非識別化と再識別化:前編「研究者間でスポーツ競技化する再識別化」 | ScanNetSecurity
2024.04.20(土)

非識別化と再識別化:前編「研究者間でスポーツ競技化する再識別化」

データを匿名化することを「非識別化」というが、これを適切に行うことは見かけ以上に難しいと、UCLA のコンピュータサイエンス教授でスケーラブル・アナィティクス・インスティチュートのディレクターであるウェイ・ワン氏は言う。

国際
非識別化と再識別化:前編「研究者間でスポーツ競技化する再識別化」
 種類を問わず、データを公開することは、政府、学術機関、企業には大きなメリットがある。しかし、規制当局は、個人のプライバシーを保護しつつその恩恵を受けるために、データの匿名化を求めている。しかし、人々がデータの「行間」を読めるとしたらどうなるだろうか。

 データを匿名化することを「非識別化」というが、これを適切に行うことは見かけ以上に難しいと、UCLA のコンピュータサイエンス教授でスケーラブル・アナィティクス・インスティチュートのディレクターであるウェイ・ワン氏は言う。

 「個人情報を削除するだけでなく、削除した後に残ったデータがまだ有用であることを念頭に置く必要があります」と彼女は言う。

 ほんの少しの手間で、残っているデータポイントから個人情報を再現できることがある。このプロセスは再識別化と呼ばれ、人々の人生を台無しにすることすらあるのだ。

 最近の事例では、あるオンライン・ニュースレターが、カトリックの神父がゲイ向けの出会い系アプリ「Grindr」を頻繁に利用していたことを暴露した。このニュースレターは、第三者のデータブローカーから Grindr の利用データを購入。このデータセットには個人を特定する情報は含まれていなかったが、ニュースレターはデバイス ID と位置情報を使い、神父を特定した。その ID は、ゲイバーや、勤務先の住所、家族の住所などに現れ、その情報は、神父の名前を探し出してアウティング(編集部註:本人が公表していない指向等を本人に無断で暴露すること)するには十分だった。その後、彼は辞職した。

 再識別化の危険性は、誰にでも重大な影響を及ぼし得る。だからこそ、匿名化されたデータセットの公開が急がれる今、人々は一度立ち止まって考えるべきだろう。一部の研究者の間では、再識別化がスポーツ競技のようになっている。例えば、ある研究チームは 2006 年に匿名の AOL 検索クエリを収集・分析し、非識別化された Netflix の利用データから個人を特定した。いずれの組織も研究の名目でデータを公開していた。2009 年には、ある同性愛者の女性が Netflix を訴え、データによって自分がアウティングされた可能性があると主張した。
《The Register》

編集部おすすめの記事

特集

国際 アクセスランキング

  1. 悪夢の検証 大英図書館ランサムウェア ~ 過ちが語る普遍的な物語

    悪夢の検証 大英図書館ランサムウェア ~ 過ちが語る普遍的な物語

  2. リムーバブルメディアに感染する Walker ワーム

    リムーバブルメディアに感染する Walker ワーム

  3. 犯罪者を騙す手口、セキュリティ技術者の潜入捜査

    犯罪者を騙す手口、セキュリティ技術者の潜入捜査

  4. サイバー攻撃の備えはアプリケーションとセキュリティチームの連携

  5. 妻の電子メールを盗み見た夫がハッキングの罪で裁判へ~Gmailが妻の婚外交渉 を明らかに(The Register)

  6. Visa・Mastercard・American Expressに加えPayPalがロシアでの事業を停止

  7. AWSスタッフ、刑務所みたいなオフィスをTikTokで自慢

  8. CrowdStrike Blog:「サイバー界のAK47」、Mimikatzを利用したシグネチャベースの検知回避

  9. Webカメラで772名の女性の着替えを覗き見した英国紳士とジュリアン・アサンジの共通点

  10. 監視カメラのハイクビジョン、「ウイグル族識別技術」で中国政府と契約 ~ NVIDIA 「中古製品の二次販売規制は不可能」

アクセスランキングをもっと見る

「経理」「営業」「企画」「プログラミング」「デザイン」と並ぶ、事業で成功するためのビジネスセンスが「セキュリティ」
「経理」「営業」「企画」「プログラミング」「デザイン」と並ぶ、事業で成功するためのビジネスセンスが「セキュリティ」

ページ右上「ユーザー登録」から会員登録すれば会員限定記事を閲覧できます。毎週月曜の朝、先週一週間のセキュリティ動向を総括しふりかえるメルマガをお届け。(写真:ScanNetSecurity 名誉編集長 りく)

×