米連邦地裁が報道機関の要求を認め、OpenAIに2000万件のChatGPTログ提供を命令。報道機関は著作権侵害の証拠を探すため、さらに削除済みチャットの復元も要求。OpenAIのデータ保全姿勢に制裁の可能性も。
OpenAI、2000万件のChatGPTログ提供命令が確定―報道機関は削除データの復元も要求
2025年1月、米連邦地方裁判所のシドニー・スタイン判事は、OpenAIに対して2000万件のChatGPTログを報道機関に提供するよう命じた判断を支持しました。この決定により、OpenAIはユーザーとの会話記録を著作権侵害訴訟の証拠として提出しなければなりません。報道機関側は、これらのログから、ChatGPTが著作権で保護された記事を無断で出力した証拠を探す計画です。さらに報道機関は、OpenAIが訴訟開始後も削除し続けていた大量のチャットログについて、復元が可能かどうかの調査と、OpenAIへの制裁措置の検討を裁判所に求めています。この訴訟は、ニューヨーク・タイムズをはじめとする報道機関が、OpenAIとマイクロソフトを相手取って起こしたもので、AI企業によるコンテンツ利用のあり方を問う重要な裁判となっています。今回の決定は、AIサービスにおけるユーザープライバシーと著作権保護のバランスをどう取るかという、今後の業界全体に影響を与える判断となります。
裁判所の判断とOpenAIの主張
スタイン判事は、オナ・ワン治安判事が下した2000万件のログ提供命令を支持しました。OpenAIは、この命令がChatGPTユーザーのプライバシーを十分に考慮していないと主張し、異議を申し立てていました。OpenAI側は、報道機関に全てのログを渡すのではなく、OpenAI自身が検索キーワードを使って著作権侵害の可能性がある出力だけを抽出し、それだけを提供する方法を提案していました。この方法なら、訴訟に関係のないユーザーの会話を保護できると主張したのです。
しかしスタイン判事は、ワン判事がユーザーのプライバシーを適切に考慮していたと判断しました。実際、提供されるログの数は当初の数百億件から2000万件に大幅に削減されています。さらに、提供されるすべてのログからは、ユーザーを特定できる情報が完全に削除されることになっています。判事はまた、著作権侵害を含まない出力ログであっても、OpenAIのフェアユース(公正使用)の抗弁に関連する可能性があるため、報道機関側がサンプル全体にアクセスする必要があると認めました。
OpenAIは「ユーザーのプライバシーへの負担が最も少ない方法」を採用すべきだと主張しましたが、スタイン判事は、この主張を裏付ける判例をOpenAIが示せなかったと指摘しました。現在OpenAIは、この命令に対抗する法的手段が残されているか検討中ですが、同社が一般ユーザーの会話を共有しないために全力を尽くすと誓った戦いは、事実上終わりに近づいています。
報道機関が求める証拠と削除されたデータ
ニューヨーク・タイムズを中心とする報道機関グループは、出力ログから著作権侵害の証拠を見つけられると考えています。具体的には、ChatGPTが報道機関の記事をそのまま出力した例や、報道機関の商標を薄めるような回答、著作権管理情報(CMI)とは記事の出典や著作者を示す情報のことですが、これを削除して無許可で記事を出力した例などを探しています。
報道機関側は、OpenAIとマイクロソフトが証拠の提出を遅らせる戦術を取っていると強く批判しています。特に問題視しているのは、OpenAIが訴訟開始後もユーザーのチャットログを削除し続けていたという点です。報道機関側の主張によれば、OpenAIが訴訟開始を知ってから、関連データの削除を停止するまでに11か月もかかったとされています。この間に削除されたデータには、ChatGPTの無料版、Pro版、Plus版の出力ログのかなりの部分が含まれており、しかもこれらは「不釣り合いに高い割合」で削除されていたといいます。
報道機関側は、有料記事の閲覧制限を回避するためにChatGPTを使うユーザーは、会話を自動削除に設定する可能性が高いため、削除されたデータにこそ侵害の証拠が含まれている可能性が高いと主張しています。OpenAIは、ニューヨーク・タイムズが訴訟を起こした翌月に全ユーザー会話データの約3分の1が削除されたことについて、「ChatGPTの会話数が(2024年の元日直前で)例外的に少なかった」という説明しかしていません。報道機関側はこれを「無関係な的外れな説明」と批判しています。
OpenAIのデータ保全姿勢への疑問
報道機関側の裁判資料によれば、OpenAIは通常の削除慣行を停止する措置を一切取らなかったとされています。さらに、「大量削除の急増」が2回あり、OpenAIはこれを「技術的な問題」によるものだと説明しています。一方で、OpenAIは自社の防御に役立つ可能性のある出力データ、特に報道機関の訴状で引用されたアカウントからのデータは確実に保持していたと報道機関側は主張しています。
OpenAIの準法務顧問であるマイク・トリン氏の証言を引用して、報道機関側は次のように述べています。「言い換えれば、OpenAIは報道機関が自社の記事をOpenAI製品から引き出した証拠は保存したが、第三者ユーザーが同じことをした証拠は削除したのです」。どれだけのデータが削除されたかは不明です。報道機関側によれば、OpenAIは削除慣行に関する「最も基本的な情報」さえ共有していないためです。しかし、マイクロソフトがCopilotのデータ保全に問題なく対応できたことから、OpenAIにももっとできたはずだと報道機関側は主張しています。
報道機関が求める追加措置
報道機関側は、OpenAIとマイクロソフトがログの共有を遅らせることで、自分たちが最も強力な訴訟を組み立てることを妨げていると主張しています。マイクロソフトに対しては、810万件のCopilotログを「直ちに」、検索可能でリモートアクセス可能な形式で提供するよう裁判所に命じることを求めています。提案された期限は1月9日、または「裁判所がこの申し立てについて判断してから1日以内」です。マイクロソフトはコメントの要請を断りました。
OpenAIに対しては、削除されたログ(「大量削除」を含む)が復元可能かどうかを明らかにするよう求めています。もし復元できれば、ユーザーが二度と日の目を見ることはないと思っていた可能性のある、さらに数百万件のChatGPT会話が訴訟に持ち込まれることになります。報道機関側は、制裁措置の可能性に加えて、OpenAIがユーザーの一時的なチャットや削除済みチャットを永久に削除することを禁じる保全命令を維持するよう裁判所に求めています。
さらに、訴訟の対象となっているOpenAIの全製品について、「破壊された出力ログデータの全範囲」を説明し、それらの削除されたチャットが復元可能かどうかを明らかにするよう、裁判所がOpenAIに命じることを求めています。復元できれば、報道機関側はそれらも証拠として調査したい考えです。
この訴訟が意味すること
この訴訟は、AI企業がインターネット上のコンテンツをどのように利用できるかという、業界全体に関わる重要な問題を扱っています。報道機関側は、OpenAIが許可なく自分たちの記事を学習データとして使用し、さらにChatGPTがそれらの記事を出力することで、報道機関の収益を損なっていると主張しています。一方OpenAIは、こうした利用はフェアユース、つまり著作権法で認められた公正な使用の範囲内だと反論しています。
今回の裁判所の決定は、AI企業に対して、訴訟に関連する可能性のあるデータを適切に保全する義務があることを明確にしました。OpenAIが訴訟開始後もデータを削除し続けていたという報道機関側の主張が認められれば、AI業界全体のデータ管理慣行に影響を与える可能性があります。また、削除されたチャットの復元が命じられれば、ユーザーが削除したと思っていた会話が法的手続きで利用される前例となり、AIサービスのプライバシーに関する認識を変える可能性もあります。
この訴訟の結果は、今後のAI開発における著作権とプライバシーのバランスをどう取るかという問題に、重要な指針を与えることになるでしょう。報道機関、AI企業、そして一般ユーザーの三者の利益をどう調整するかが、今後の焦点となります。
