AIが匿名SNSアカウントの投稿者を特定、最大68%の精度で個人識別に成功

研究者がAIを使って匿名アカウントの投稿者を特定する技術を発表。最大68%の確率で個人を識別可能に。SNSでの匿名性が大きく損なわれる可能性があり、プライバシー保護の前提が崩れつつあります。

AIが匿名SNSアカウントの投稿者を特定、最大68%の精度で個人識別に成功

2026年3月、研究者チームがAI技術を使って匿名のSNSアカウントから投稿者本人を特定できることを実証しました。この研究では、大規模言語モデル(LLMとは、人間のような文章を理解し生成できるAI技術のことです。ChatGPTなどがその例です)を使い、最大68%の確率で匿名ユーザーを正しく識別することに成功しました。さらに、特定した人物が本当に正しいかを示す精度は最大90%に達しました。これまで、匿名アカウントの投稿者を特定するには、専門家による手作業や膨大なデータの照合が必要でした。しかし、AIの進化により、この作業が安価かつ迅速に実行できるようになったのです。この発見は、多くの人がSNSで使ってきた「匿名性」という防御手段が、もはや十分ではなくなりつつあることを意味します。センシティブな話題について匿名で発言していた人々が、個人を特定され、ストーカー行為やプライバシー侵害のリスクにさらされる可能性が高まっています。

研究の具体的な内容と成果

研究チームは、複数のSNSプラットフォームから公開データを収集し、実験を行いました。実験では、投稿内容から個人を特定できる情報をすべて削除した状態で、AIに分析させました。その結果、AIは投稿の文体や話題、言及する内容のパターンから、元の投稿者を推測できることが判明しました。

具体的な実験の一つでは、Hacker NewsとLinkedInのプロフィールを照合しました。別の実験では、Redditの映画関連コミュニティでの投稿を分析しました。映画について多く語るほど、個人の特定が容易になることがわかりました。1本の映画について語った場合、90%の精度で3.1%のユーザーを特定できました。10本以上の映画について語った場合、その割合は48.1%まで上昇しました。

さらに注目すべきは、アンケート回答のような一般的な情報からでも個人を特定できた点です。Anthropic社が実施したAI利用に関するアンケートの回答者125人のうち、7%を正しく特定することに成功しました。この成功率は現時点では低いものの、AIの能力向上とともに今後さらに高まると研究者は警告しています。

背景と経緯

インターネット上では長年、匿名性が一定のプライバシー保護手段として機能してきました。多くの人が本名とは異なるハンドルネームを使い、個人的な悩みや政治的意見、趣味の話題などを自由に発信してきました。この匿名性は完璧ではありませんでしたが、個人を特定するには専門知識と多大な労力が必要だったため、実用的な保護手段とされてきました。

従来の個人特定手法は、構造化されたデータセット同士を照合する方法が主流でした。2008年のNetflix賞攻撃と呼ばれる研究では、視聴履歴データから個人を特定し、その人の政治的傾向まで推測できることが示されました。しかし、この手法には専門家による手作業と、特定の形式に整理されたデータが必要でした。

状況が変わったのは、大規模言語モデルの登場です。これらのAIは、人間のようにウェブを閲覧し、自由形式のテキストから情報を抽出し、推論を行えます。この能力により、従来は困難だった匿名ユーザーの大規模な特定が現実的になりました。

技術的な詳細

この技術は、AIエージェントと呼ばれる自律的に行動するプログラムを使います。AIエージェントとは、目標を与えられると自分で計画を立て、ウェブ検索やデータ分析を実行し、結果を検証するAIシステムのことです。人間の調査員が行う作業を自動化したものと考えるとわかりやすいでしょう。

具体的な動作の流れは次のとおりです。まず、AIは匿名化された投稿やインタビュー記録から、個人を特定できそうな手がかりを抽出します。例えば、職業、居住地域、趣味、過去の経験などです。次に、これらの手がかりをもとにウェブ検索を実行し、該当しそうな人物の候補を見つけます。最後に、候補者の公開情報と元の投稿内容を照合し、一致度を評価します。

従来の手法との大きな違いは、AIが非構造化データ、つまり普通の文章から直接情報を抽出できる点です。人間が読んで理解するような文章を、AIも同じように理解し、そこから意味のある情報を取り出せるのです。また、AIは複数の情報源を横断的に検索し、パターンを見つけ出す能力に優れています。

できること・できないこと

この技術により、匿名アカウントの投稿者を大規模かつ自動的に特定することが可能になります。例えば、特定のトピックについて複数回投稿している人や、個人的な経験を詳しく語っている人は、比較的容易に特定できます。映画の感想を10本以上投稿している場合、約半数のユーザーが高精度で特定される可能性があります。また、職業や居住地、趣味などの情報が含まれるインタビューやアンケート回答からも、一定の割合で個人を特定できます。

一方で、まだ完璧ではない部分もあります。現時点では、すべての匿名ユーザーを特定できるわけではなく、誤った推測も発生します。投稿内容が少ない場合や、個人的な情報をほとんど含まない場合は、特定が困難です。また、意図的に誤情報を混ぜたり、文体を変えたりすることで、特定を難しくすることも可能です。ただし、AIの能力は急速に向上しており、今後数年でこれらの制約は大幅に緩和されるでしょう。

私たちへの影響

このニュースは、SNSを利用するすべての人に重大な影響を与えます。特に、匿名アカウントを使って個人的な悩みや政治的意見、批判的なコメントを投稿している人は、個人が特定されるリスクが大幅に高まります。

短期的な影響については、すでに技術が実用段階にあることです。悪意ある個人や組織が、この技術を使って特定の人物を追跡したり、嫌がらせの対象を見つけたりする可能性があります。企業は顧客の匿名投稿を分析し、詳細なマーケティングプロファイルを作成できます。政府機関は、オンラインで批判的な発言をしている市民を特定できます。

中長期的な影響としては、インターネット上での自由な発言が萎縮する可能性が考えられます。匿名性が保証されないとわかれば、人々は率直な意見を述べることをためらうようになるでしょう。これは、オンラインコミュニティの健全性や、民主的な議論の質に悪影響を及ぼす恐れがあります。また、プライバシー保護の考え方そのものを見直す必要が出てくるかもしれません。

ただし、対策も存在します。研究者は、SNSプラットフォームがAPIアクセスに制限をかけたり、自動スクレイピングを検出したりすることを提案しています。AI提供企業も、個人特定目的での利用を検知し、拒否する仕組みを導入できます。個人レベルでは、SNSの利用を控えめにしたり、定期的に古い投稿を削除したりすることが有効です。最も確実な方法は、最初から個人を特定できる情報を投稿しないことですが、それでは匿名SNSの利点が失われてしまいます。

出典:LLMs can unmask pseudonymous users at scale with surprising accuracy(arstechnica.com)

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です