“`html
Google DeepMindが開発したタンパク質構造予測AI「AlphaFold」が2020年11月の発表から5年を迎えた。2億以上のタンパク質構造を予測し、190カ国350万人の研究者が利用。2024年にはノーベル化学賞を受賞し、生物学と化学を永遠に変えた。
AlphaFoldが5周年、タンパク質予測AIが科学を変えた5年間
Google DeepMindが開発した人工知能システム「AlphaFold」が、2020年11月の発表から5年を迎えました。AlphaFoldとは、タンパク質の立体構造を原子レベルの精度で予測できるAIシステムのことです。タンパク質は生命活動に欠かせない物質ですが、その形を調べるには従来、何年もかかる実験が必要でした。AlphaFoldはこの問題を解決し、現在では2億以上のタンパク質構造を予測したデータベースを構築しています。このデータベースは世界190カ国の約350万人の研究者に利用されており、2024年にはノーベル化学賞を受賞しました。WIREDはDeepMindの研究担当副社長であるプシュミート・コーリ氏にインタビューし、AlphaFoldのこれまでの5年間と、今後の展望について話を聞きました。この技術は医薬品開発や病気の理解を加速させ、私たちの健康と医療の未来に大きな影響を与えると期待されています。
AlphaFoldの5年間の成果
AlphaFoldは2020年11月に発表される前、DeepMindは囲碁の世界チャンピオンを破るAIを開発したことで知られていました。その後、同社は深層学習アルゴリズムを現代科学の最も困難な問題の一つである「タンパク質折りたたみ問題」に応用しました。タンパク質折りたたみ問題とは、アミノ酸の配列からタンパク質がどのような立体構造になるかを予測する問題のことです。
AlphaFold2の成果は目覚ましいものでした。現在、2億以上の予測構造を含むデータベースを構築し、これは既知のタンパク質宇宙のほぼ全体をカバーしています。2021年にNature誌に発表されたアルゴリズムの論文は、これまでに4万回引用されています。この数字は、科学界でいかに広く使われているかを示しています。
2024年には、AlphaFold3が登場しました。これはタンパク質だけでなく、DNA、RNA、医薬品分子の構造予測にも対応しています。ただし、タンパク質の無秩序な領域では「構造的幻覚」と呼ばれる誤った予測が生じる課題もあります。それでも、この進化は未来への重要な一歩となっています。
ゲームから科学への転換
コーリ氏によれば、科学は創設当初からDeepMindの中心的使命でした。創設者のデミス・ハサビス氏は、AIが科学的発見を加速させる最高のツールになり得るという考えでDeepMindを設立しました。囲碁などのゲームは常に試験場であり、最終的には現実世界の問題に取り組むための技術を開発する手段だったのです。
コーリ氏の役割は、AIが変革的な影響を与えられる科学的問題を特定し、進歩を実現するために必要な要素を明確にし、これらの大きな課題に取り組む学際的なチームをまとめることでした。AlphaGoが証明したのは、ニューラルネットワークと計画・探索を組み合わせることで、非常に複雑なシステムを習得できるということです。タンパク質折りたたみ問題も同じ特性を持っていました。
決定的な違いは、この問題を解決することで、生物学と医学全体にわたる発見が解き放たれ、人々の生活を本当に改善できるということでした。DeepMindは「根本ノード問題」と呼ばれる領域に焦点を当てています。これは、科学コミュニティが解決策が変革的であると同意しているものの、従来のアプローチでは今後5年から10年では到達できない領域のことです。知識の木のように考えると、これらの根本問題を解決すれば、研究の全く新しい枝が開かれるのです。
AIの「幻覚」問題への対処
AIの「幻覚」とは、AIが事実に基づかない情報を生成してしまう現象のことです。コーリ氏は、創造的な生成モデルと厳格な検証システムを組み合わせる「ハーネス」アーキテクチャの重要性を繰り返し主張してきました。
AlphaFold2からAlphaFold3への進化において、この哲学は変わっていません。変わったのは、より野心的な問題にこの原則をどう適用するかです。AlphaFold3では拡散モデルを使用していますが、これは本質的により「想像力豊か」で幻覚を起こしやすいモデルです。拡散モデルとは、ノイズから徐々に構造を生成していく手法のことです。
拡散モデルへの移行は、科学が要求したものでした。個々のタンパク質構造だけでなく、タンパク質、DNA、RNA、小分子がどのように相互作用するかを予測する必要があったのです。幻覚の懸念に対しては、検証がさらに重要になります。AlphaFold3には信頼度スコアが組み込まれており、予測の信頼性が低い可能性がある場合に警告を発します。これは特に本質的に無秩序なタンパク質で重要です。
しかし、このアプローチを本当に検証しているのは、5年間にわたって科学者たちが実験室でAlphaFoldの予測を繰り返しテストしてきたことです。科学者たちがAlphaFoldを信頼するのは、実際に機能するからです。
AI共同研究者の登場
DeepMindは「AI共同研究者」と呼ばれる新しいシステムを開発しています。これはGemini 2.0上に構築されたエージェントシステムで、仮説を生成し、議論します。これは科学的方法をシステム化したものと言えます。
コーリ氏は、科学者の時間の使い方が変わると見ています。科学者は常に二つの役割を果たしてきました。どの問題を解決する必要があるかを考えることと、それをどう解決するかを考えることです。AIが「どう解決するか」の部分をより多く支援することで、科学者は「どの問題が実際に問われるべきか」に集中する自由を得られます。
共同研究者システムは、この協力関係を念頭に設計されています。これはGemini 2.0で構築されたマルチエージェントシステムで、仮想的な協力者として機能します。研究のギャップを特定し、仮説を生成し、実験的アプローチを提案します。最近、インペリアル・カレッジの研究者たちは、特定のウイルスがどのように細菌を乗っ取るかを研究する際にこのシステムを使用し、抗菌薬耐性に対処する新しい方向性を開きました。
しかし、検証実験を設計し、世界的な健康への重要性を理解したのは人間の科学者でした。重要なのは、これらのツールの強みと限界の両方を適切に理解することです。その理解こそが、科学者が責任を持って効果的にツールを使用できるようにするものです。
できること・できないこと
AlphaFoldにより、タンパク質の立体構造を数分から数時間で予測することが可能になりました。例えば、新しい医薬品の標的となるタンパク質の構造を迅速に調べたり、病気に関連するタンパク質の変異がどのように構造に影響するかを理解したりすることができます。AlphaFold3では、タンパク質だけでなく、DNAやRNA、医薬品分子との相互作用も予測できるようになりました。
一方で、まだ難しいこともあります。タンパク質の中には構造が定まらない「無秩序領域」と呼ばれる部分があり、ここでは予測の精度が下がることがあります。また、タンパク質が実際に折りたたまれる過程や、時間とともに構造がどう変化するかといった動的な情報は、現在のAlphaFoldでは完全には捉えられません。今後数年で、これらの課題に対する改善が進むでしょう。
私たちへの影響
このニュースは、医療や創薬に関心のある一般の人々、そして研究者に大きな影響を与えます。AlphaFoldの進化により、新しい医薬品の開発が加速される可能性があります。従来は何年もかかっていたタンパク質構造の解明が短時間で可能になることで、病気の治療法の発見が早まることが期待されます。
短期的な影響については、すでに世界中の研究機関でAlphaFoldが使われており、がん、アルツハイマー病、感染症などの研究が進んでいます。中長期的な影響としては、個別化医療の実現や、これまで治療法がなかった難病への新しいアプローチが考えられます。コーリ氏は今後5年間の目標として、完全な人間の細胞の正確なシミュレーションを作成することを挙げています。
ただし、AIが生成する予測はあくまで予測であり、実験による検証が必要です。また、AIが科学研究を支援するツールであっても、どの問題に取り組むべきかを決めるのは人間の科学者です。技術の進歩と人間の判断のバランスが、今後も重要になるでしょう。
“`
