【情報/AI/管理】データの匿名化はウソだと欧州の研究者グループが解明[08/09]

■ このスレッドは過去ログ倉庫に格納されています
1一般国民 ★2019/08/09(金) 15:09:52.44ID:CAP_USER
データの匿名化はウソだと欧州の研究者グループが解明
https://jp.techcrunch.com/2019/07/25/2019-07-24-researchers-spotlight-the-lie-of-anonymous-data/
2019/7/25 by Natasha Lomas
TechCrunch,https://jp.techcrunch.com

【科学(学問)ニュース+、記事全文はソースをご覧ください】

ヨーロッパの2つの大学の研究者たちが、匿名化されたデータセットから、たった15のデモグラフィック属性から99.98%の精度で個人を再識別できるとされる方法を公表した。

個人情報の複雑なデータセットは、情報サンプル(サブセット)を分離するといった今の匿名化方式では再特定を防げないことを、彼らのモデルは示唆している。

つまり、匿名化して公開された大きなデータセットで、厳格なアクセス制限なくして再特定に対して安全なものはひとつもないということだ。

「私たちの研究が示しているのは、大量にサンプリングされた匿名化データセットであっても、GDPR(EU一般データ保護規則)に明記された最新の基準を満たせず、公開したらそれっきりという非特定化モデルによる匿名化の技術的、法的な妥当性を著しく阻害します」と、インペリアル・カレッジ・ロンドンとベルギーのルーヴァン・カトリック大学の研究者たちは、Nature Communicationsに掲載された論文の要約の中に書いている。

当然ながら今回の研究は、データの匿名化を元に戻せることを初めて証明したものではない。この論文に関わった研究者の一人、インペリアル・カレッジ・ロンドンのイブ=アレキサンダー・デ・モントイ(Yves-Alexandre de Montjoye)氏は、これ以前の研究でも、たとえば、クレジットカードのメタデータから、わずか4つの情報の断片をランダムに抽出するだけで、買い物をした人の90%を、一意の個人として再特定できることを証明している。

スマートフォンの位置情報のプライバシー侵害問題について調査した、デ・モントイ氏が共同筆者となった別の研究論文によれば、たった4つの時空間地点からなるデータセットから、95%の個人を一意に特定することに成功したという。

同時に、寄せ集められたデータから簡単に個人が特定できてしまうというこれらの研究結果があるにも関わらず、マーケティング目的でブローカーが売買しているような匿名化された顧客データセットには、その何倍もの個人の属性データが含まれている恐れがある。

たとえば研究者たちは、データブローカーのExperianがAlteryxにアクセス権を販売した匿名化されたデータセットには、米国の1億2000万世帯の、世帯あたり248の属性データが含まれていたことを引き合いにい出している。

彼らのモデルから見れば、基本的に、これらの世帯はみな再特定される危険性がある。それでも、大量のデータセットが、匿名化という甘い言葉に載せられて、今でも取り引きされている。

個人情報がどれだけ商用目的で取り引きされているかに関して、さらに怖い話を聞きたい方に教えよう。あの悪評高い、すでに廃業した、政界にデータを売る会社Cambridge Analyticaは、昨年、こう話していた。それは、Facebookのデータ不正利用スキャンダルの最中のことだ。米国人有権者をターゲットにした内密な活動の基礎となったデータセットは、Acxiom、Experian、Infogroupといった有名データブローカーからライセンスされたものだった。とくに同社が強調していたのは、「米国人個人の無数のデータ点」は「超大手の信頼あるデータ収集業者とデータ販売業者」から合法的に入手したということだ。

匿名データセットから、驚くほど簡単に個人を再特定できてしまうことを、研究者たちは何年間にもわたり示してきたが、今回の研究の最大の成果は、あらゆるデータセットからどれだけ簡単に個人を特定できるかを見積もれる統計モデルを構築したことにある。

彼らは、データのマッチングが正しい可能性を演算することで、これを実現している。そのため、基本的に、マッチの一意性が評価される。また彼らは、小さなサンプリングの断片がデータの再特定を許してしまうことも突き止めた。

「人口統計と調査データからの210件のデータセットを使って私たちのアプローチを検証したところ、非常に小さなサンプリングデータの断片であっても、再特定の防止や個人データの保護の妨げになることがわかりました」と彼らは書いている。・・・

■■略

[原文へ]https://techcrunch.com/2019/07/24/researchers-spotlight-the-lie-of-anonymous-data/

(翻訳:金井哲夫)

2ニュースソース検討中@自治議論スレ2019/08/09(金) 15:12:38.98ID:yB/Bn3dZ
1)データーはデーターと関連付けられるからデーターたり得る
2)データーの精度が高ければ、データーの出典元を形づけられる
3)データーはデーター相互に連携できるからデーターとして役立つ

とう理屈だけで、個人が特定できる事が立証される

3ニュースソース検討中@自治議論スレ2019/08/09(金) 15:13:38.00ID:GTCCx+Rm
まあ隠れるのは無意味だな

4ニュースソース検討中@自治議論スレ2019/08/09(金) 15:23:59.28ID:PY0MLtow
アキネイターと同じだろ

項目が少なくても個人の特定は可能

5ニュースソース検討中@自治議論スレ2019/08/09(金) 15:26:26.31ID:9lBNCkkQ
毎日同じ電車に乗ってるおっさんを知ってるけど、興味がないデータだからって特定できても、仕方がないんだな

6ニュースソース検討中@自治議論スレ2019/08/09(金) 15:29:39.13ID:fZuX8k1x
データの匿名性は破れてるのいやまだだのと何年もやってたけど結局特定可能って事?

7ニュースソース検討中@自治議論スレ2019/08/09(金) 15:40:58.25ID:DKBqTmUd
数百万の架空の有名人まで含むデータの中から
十数個の質問で一個を特定してしまう
アキネの存在がすべてを物語っている

8ニュースソース検討中@自治議論スレ2019/08/09(金) 15:43:35.44ID:stNZXSoC
>>5
そういう事言うやつよくいるけど
結局お前がデータを活用できないって言ってるだけなのに悲しくならないんか?
自分の発想の乏しさを興味のなさに転換してるだけや

9ニュースソース検討中@自治議論スレ2019/08/09(金) 15:44:34.97ID:A1HhTcOd
キャッシュもIPも抜きまくりだろ
Andromedaなんか端末再起動してもファイルで保存してるし

10ニュースソース検討中@自治議論スレ2019/08/09(金) 15:45:51.26ID:F1piAPQH
2万2000のポルノサイトを分析したら74%がグーグルにデータを送信していた
https://asahi.5ch.net/test/read.cgi/newsplus/1563632087/

11ニュースソース検討中@自治議論スレ2019/08/09(金) 15:47:53.91ID:A1HhTcOd
それより
ネットでなんか買うと
ずっと「オマエこれ買っただろ」って出てくる広告
なんとかならんかな
ズラッとTENGA広告が並んだときは
顔から火が出たわ

12ニュースソース検討中@自治議論スレ2019/08/09(金) 16:04:10.60ID:IzqIsaeo
AI「知ってた

13ニュースソース検討中@自治議論スレ2019/08/09(金) 16:33:52.28ID:21yq5F6G
プライバシーなんてあってないようなもんなんだよねえww
いくつかのデータがあればネット上はある個人を再現できるんだから、死んでも
死なないってことにもなるんだろうけどww

14ニュースソース検討中@自治議論スレ2019/08/09(金) 19:04:40.31ID:wfVWtsvP
>>11
買ったのかよw
ブラウザに保存されてるクッキーを消せば消えるよ

15ニュースソース検討中@自治議論スレ2019/08/09(金) 19:31:25.42ID:SHLGYGxY
"お前は見られている"
とか常に思ってるほうがモラルは高くなるかもしれんがな
ネットでも変な言動を取りづらくはなるかも
監視者が邪悪な恐怖政治組織とかじゃなけりゃあなあ
"グーグルさまが見てる"

16ニュースソース検討中@自治議論スレ2019/08/09(金) 19:44:33.20ID:jbPmLjwv
5ちゃんに書き込んでることバレるの?

17ニュースソース検討中@自治議論スレ2019/08/09(金) 19:47:06.87ID:jIvG1D7c
>>115
5chも特定されとるのにヘイト消えんだろ
お隣の国なんてもっと嫌がらせえせ歴史からヘイトしまくってるのも放置だろ

18ニュースソース検討中@自治議論スレ2019/08/09(金) 19:58:08.16ID:wety9qZq
できるだけデマをバラ撒くしかないな
ビッグデータをゴミにするほどの量で

19ニュースソース検討中@自治議論スレ2019/08/09(金) 20:36:12.26ID:apc/YRVC
一番いいのはネットにアクセスしないこと
次はデータが入っているものを物理的に壊すことかな

20ニュースソース検討中@自治議論スレ2019/08/09(金) 20:38:20.80ID:t6IRjukg
l-多様性を満たしても?

21ニュースソース検討中@自治議論スレ2019/08/09(金) 20:42:52.39ID:28VQHuCZ
行動統計学の論文で、日本人1億2千万人なら8〜12,3項目くらいあれば
80%前後の確率での個人特定が可能だっていうのを読んだことあるよ
>>1の数字もまあ、あり得るのかなと思う

22ニュースソース検討中@自治議論スレ2019/08/09(金) 20:48:05.27ID:t6IRjukg
生徒の成績のデータをUSBメモリに入れて持ち歩くのは危険?
生徒の名前をidに変えて匿名化してもあかんの?

23ニュースソース検討中@自治議論スレ2019/08/09(金) 21:24:09.70ID:p1C74hsp
>>1
ネットの遊びの魔神が適当に有名人を出してくれるヤツ

24ニュースソース検討中@自治議論スレ2019/08/09(金) 23:25:28.79ID:ifBcMvMO
おれが実況スレでおっぱいおっぱい言ってるのが特定されるのか

25ニュースソース検討中@自治議論スレ2019/08/10(土) 06:07:36.18ID:qh0twIFS
GAFA「余計なことを言うな。由らしむべし知らしむべからず。」

26ニュースソース検討中@自治議論スレ2019/08/16(金) 15:32:27.90ID:Y+6yLneu
よくある映画とかで、銀行に忍び込むために同じビルに入っている小さな会社の社員の個人情報を掴んで
なりすましたりするとか、清掃会社社員の個人情報をつかってビルに侵入するとか、あるよね。

DDoSアタックも初期は個人のパソコンをハッキングしまくって攻撃してたし、個人情報って思ったよりも使い勝手があるよ。

冤罪攻撃もあるし。

27ニュースソース検討中@自治議論スレ2019/08/18(日) 11:30:24.46ID:eKYZqQ7e
献血した奴で皇胤はすべてマークされているだろうなwww

28よっちゃん2019/08/28(水) 19:30:06.69ID:z6msK0/V
再生核研究所声明 470 (2019.2.2)  
ゼロ除算 1/0=0/0=z/0=\tan(\pi/2)=0 発見5周年を迎えて


http://vixra.org/pdf/1908.0100v1.pdf

Unique-IP document downloads: 506 times
Fundamental of Mathematics; Division by Zero Calculus and a New Axiom

29ニュースソース検討中@自治議論スレ2019/09/01(日) 11:23:27.99ID:WEpIPBlf
完全の安全が不可能なように完全な匿名化も不可能性しょう。

30ニュースソース検討中@自治議論スレ2019/09/01(日) 11:37:20.29ID:+unNnCOk
>>4
>>7

兄貴がどうかしたのか

31ニュースソース検討中@自治議論スレ2019/09/01(日) 11:58:16.09ID:QE7ONcsP
>>2
男か女か程度のデータなら特定できない

はい論破

32ニュースソース検討中@自治議論スレ2019/09/01(日) 12:33:10.26ID:b/7DB+mI
>>1
スノーデンは今日(米国時間2014/10/12)、New Yorker Festivalの中でリモートインタビューを受け、
プライバシーを守るために、何がわれわれにできるかについていくつか質問に答えた。

最初の回答は、政府方針の改革についてだった。
自分には「隠すものは何もない」という立場を取る人々に対して、
それは「権利のしくみに関する責任の在り方を覆すことだ」と反論した。

「私には隠す物など何もない」と言うことは「この権利のことなど私にはどうでもよい」と言っているのと同じだ。
つまりは「私はこの権利を持っていない、なぜならそれを正当化しなくてはならなくなったからだ」とあなたは言っている。
本来、政府によるあなたの権利に対する侵害は、政府が正当化しなくてはならない。
*****

665 名前:名無しさん@1周年 Mail: 投稿日:2019/01/05(土) 16:56:28.80 ID:PO/FMEdW0
結局自分が正しくないとわかってる奴は論点をずらしてわめき散らすしかない



33ニュースソース検討中@自治議論スレ2019/11/06(水) 10:43:59.37ID:Vdw6hd5m
>>27
ワジンのワをもって尊しと成す

34ニュースソース検討中@自治議論スレ2019/11/06(水) 10:46:50.22ID:Vdw6hd5m
>>19
ゲイツが早い段階で警告していたw

まぁ〜セキュリティー企業などあまり信用しない方が良いw

35ニュースソース検討中@自治議論スレ2019/11/06(水) 11:05:56.27ID:cnMDaQZU
政府の統計目的ならともかく、民間企業が使う場合は個人の氏名と紐づけされて
ないとあまり意味がないからね。
表向きは匿名化したデータということになってても、まず個人情報と紐づけているとみて
間違いはないと思う。

36ニュースソース検討中@自治議論スレ2019/11/06(水) 12:28:00.72ID:Vdw6hd5m
この手のスレは収納こに保管されて書き込み出来ないのが通例なんじゃね?

書き込みテストして見たんだけどw

37ニュースソース検討中@自治議論スレ2019/11/06(水) 13:16:18.64ID:IE8rVH7H
何年か前にキャッシュレス決済のいくつかの情報だけで個人を突き止めるとこが可能って記事を読んだ

38ニュースソース検討中@自治議論スレ2019/11/06(水) 20:09:57.56ID:btDE19bY
スマホにあらゆる情報を入れてるやつが信じられない
銀行やクレジットも一本化してこれ一台で何でもできるウェーイ

39ニュースソース検討中@自治議論スレ2019/11/06(水) 20:49:28.45ID:aQu14m06
>>11
トヨタのTNGA技術を調べてただけなんです!!
って必死に言い訳すると、みんな生暖かく見守ってくれるよ

■ このスレッドは過去ログ倉庫に格納されています