Google DeepMindのノーベル賞受賞者ジョン・ジャンパー氏が、タンパク質構造予測AI「AlphaFold」の5年間の成果と今後を語った。200万種のタンパク質構造を予測し、創薬や生物学研究を加速。ただし予測の限界もあり、慎重な利用が必要。
AlphaFold開発者が語る5年間の成果:タンパク質予測AIが変えた科学研究の現場
2024年にノーベル化学賞を受賞したGoogle DeepMindのジョン・ジャンパー氏が、タンパク質構造予測AI「AlphaFold」の5年間の成果について語りました。AlphaFoldとは、生物の体を構成するタンパク質の立体構造を、従来は数ヶ月かかっていた作業を数時間で予測できるAIシステムのことです。2020年の発表以来、世界中の科学者が利用し、現在では約2億種類のタンパク質構造を予測しています。これは科学界で知られているほぼすべてのタンパク質に相当します。ジャンパー氏は「科学者たちが予想以上に責任を持って使用している」と評価する一方で、「予測には限界があり、ChatGPTのように自信を持って間違うこともある」と注意を促しています。この技術は創薬開発、病気の研究、さらにはミツバチの病気抵抗性の研究まで、幅広い分野で活用されており、科学研究のスピードを大きく加速させています。
AlphaFoldとは何か:50年来の難問を解決したAI
AlphaFoldは、タンパク質の立体構造を予測する人工知能システムです。タンパク質とは、筋肉や免疫システムなど、生物の体を動かすための「生物学的な機械」のことです。これらは20種類のアミノ酸という部品が鎖のようにつながり、複雑に折りたたまれて立体構造を作ります。
この立体構造を知ることは、タンパク質がどんな働きをするのか、病気にどう関わっているのかを理解するために不可欠です。しかし、アミノ酸の並び方から最終的な形を予測することは、50年間にわたって生物学の大きな課題でした。理論上、ほとんどのタンパク質は天文学的な数の形を取る可能性があるからです。
ジャンパー氏とデミス・ハサビスCEOが率いるチームは、2020年にAlphaFold 2を発表しました。このシステムは、大規模言語モデルと同じ「トランスフォーマー」という技術を使っています。トランスフォーマーとは、大きなパズルの中で特定の部分に注目することが得意な神経回路網のことです。例えば、文章の中で重要な単語を見つけ出すような作業が得意です。
開発の経緯と技術的な突破口
ジャンパー氏は2017年、理論化学の博士号を取得した直後にGoogle DeepMindに応募しました。当時、同社がゲームで人間を超える性能を持つAIの開発から、タンパク質構造予測という秘密プロジェクトに移行したという噂を聞いたからです。
わずか3年後の2020年、AlphaFold 2は原子の幅程度の精度でタンパク質構造を予測することに成功しました。これは研究室で行う精密な実験技術と同等の精度で、しかも数ヶ月かかる作業を数時間で完了できるものでした。
成功の鍵は、高速でテストできる試作モデルを作ったことだとジャンパー氏は語ります。「信じられない速さで間違った答えを出すシステムを作りました」と彼は言います。これにより、様々なアイデアを大胆に試すことができたのです。チームは、異なる生物種でタンパク質がどのように似た形に進化してきたかなど、タンパク質構造に関するあらゆる情報を神経回路網に詰め込みました。
AlphaFoldでできること・できないこと
AlphaFoldにより、タンパク質の構造予測が劇的に速くなりました。例えば、ワシントン大学のデビッド・ベイカー氏は、AlphaFoldを使って合成タンパク質の設計を10倍速くしています。合成タンパク質とは、病気の治療やプラスチックの分解など、特定の目的のために人工的に設計されたタンパク質のことです。ベイカー氏のチームは、設計したタンパク質の構造をAlphaFoldで予測し、自信を持って予測できたものだけを実際に作ることで、効率を大幅に向上させました。
また、AlphaFoldを検索エンジンのように使う研究者もいます。人間の精子と卵子が受精する際に関わるタンパク質を探していた研究グループは、既知の卵子のタンパク質と、2000種類の精子表面のタンパク質をAlphaFoldで組み合わせて予測しました。その結果、卵子に結合するタンパク質を特定し、実験室で確認することができました。従来なら2000種類の構造を調べることは現実的ではありませんでした。
一方で、AlphaFoldにも限界があります。複数のタンパク質の相互作用や、時間経過に伴う変化の予測は、単一のタンパク質構造の予測ほど正確ではありません。カリフォルニア大学サンフランシスコ校のクリメント・ベルバ氏は「予測結果を見て、これが本当なのかどうか頭を悩ませることが多い」と語ります。彼は「ChatGPTと同じで、間違った答えでも正しい答えと同じくらいの自信を持って出してくる」と指摘しています。
科学研究の現場での活用事例
AlphaFoldは予想外の分野でも使われています。ジャンパー氏が挙げた例の一つは、ミツバチの病気抵抗性の研究です。「群れの崩壊を研究する中で、特定のタンパク質を理解したいと考えた研究グループがいました」と彼は言います。「AlphaFoldがミツバチ科学に使われるとは思っていませんでした」
ベルバ氏の研究室では、AlphaFold 2と3の両方を毎日使用しています。それぞれ異なる強みがあるためです。彼らは実験室で実験を行う前に、AlphaFoldで仮想実験を実行します。その結果を使って実験の焦点を絞り込んだり、実験を行う価値があるかどうかを判断したりしています。
Google DeepMindは、AlphaFoldを世界中の研究者が使用・更新する巨大なタンパク質データベース「UniProt」に適用しました。現在、科学界で知られているほぼすべてのタンパク質、約2億種類の構造を予測しています。ただし、ジャンパー氏は「これは予測のデータベースであり、予測に伴うすべての注意事項が付いてきます」と慎重な姿勢を示しています。
私たちへの影響
AlphaFoldは、医療や創薬の分野に大きな影響を与えています。新しい薬を開発する際、病気に関わるタンパク質の構造を知ることは非常に重要です。AlphaFoldにより、この作業が数ヶ月から数時間に短縮されたことで、創薬のスピードが加速しています。
短期的には、研究者がより多くのタンパク質を調べられるようになり、病気のメカニズムの解明が進むでしょう。中長期的には、これまで治療法がなかった病気に対する新しい薬の開発が期待されます。また、環境問題の解決にも役立つ可能性があります。例えば、プラスチックを分解する合成タンパク質の開発などです。
ただし、AlphaFoldは万能ではありません。予測には限界があり、実験室での確認が依然として必要です。また、複雑な相互作用の予測では精度が落ちることもあります。科学者たちは、AlphaFoldの結果を鵜呑みにせず、慎重に解釈しながら使用することが重要です。ジャンパー氏が「科学者たちが責任を持って使用している」と評価するように、この技術は適切に使えば科学研究を大きく前進させる強力なツールとなります。
