元DeepMind研究者が11億ドル調達、人間データ不要の「自己学習AI」開発へ

元DeepMind研究者デビッド・シルバー氏が創業したIneffable Intelligenceが11億ドルを調達。人間のデータに頼らず自ら学習するAI「スーパーラーナー」を開発。評価額は51億ドルに達した。

元DeepMind研究者が11億ドル調達、人間データ不要の「自己学習AI」開発へ

2026年4月、元DeepMind研究者のデビッド・シルバー氏が創業したばかりの英国AI企業Ineffable Intelligenceが、11億ドル(約1,650億円)の資金調達を発表しました。企業評価額は51億ドル(約7,650億円)に達しています。同社が目指すのは、人間が作成したデータに頼らず、自ら試行錯誤を繰り返して知識とスキルを獲得する「スーパーラーナー」と呼ばれるAIシステムです。これは、現在主流の大規模言語モデルとは根本的に異なるアプローチです。大規模言語モデルは膨大な人間の文章データから学習しますが、スーパーラーナーは自分自身の経験だけから学びます。シルバー氏はDeepMindで10年以上にわたり強化学習チームを率い、人間の戦略を一切教えずに囲碁やチェスでプロ棋士を破るAI「AlphaZero」の開発に携わった人物です。この実績が、創業からわずか数カ月での大型調達を可能にしました。

11億ドル調達の詳細と投資家

Ineffable Intelligenceの資金調達ラウンドは、米国の著名ベンチャーキャピタルであるSequoia CapitalとLightspeed Venture Partnersが主導しました。これに加えて、Index Ventures、Google、Nvidia、英国政府系のBritish Business Bank、そして英国が最近立ち上げたAI専門の国家ファンドSovereign AIなどが参加しています。創業からわずか数カ月で51億ドルの評価額を獲得したことは、AI業界では「ペンタコーン」と呼ばれる地位です。ペンタコーンとは、評価額が50億ドルを超える企業を指す造語です。この規模の初期調達は「ココナッツラウンド」と業界で呼ばれています。これは通常の「シードラウンド」をはるかに超える規模であることを皮肉った表現です。著名な研究者が創業するAI企業には、実績がほとんどない段階でも巨額の資金が集まる傾向があります。

デビッド・シルバー氏の経歴と実績

デビッド・シルバー氏は、ユニバーシティ・カレッジ・ロンドンの教授であり、つい最近までGoogle傘下のDeepMindで強化学習チームを率いていました。DeepMindでの10年以上の在籍期間中、シルバー氏はチェスや囲碁でプロ棋士を破るプログラムの開発に中心的な役割を果たしました。特に有名なのが「AlphaZero」です。AlphaZeroは、人間の戦略や過去の対局記録を一切学習せず、純粋に自己対戦を繰り返すことで、それぞれのゲームで世界最強のコンピュータプログラムを打ち負かしました。この「人間のデータなしで学習する」というアプローチこそが、強化学習と呼ばれる技術の核心です。強化学習とは、AIが試行錯誤を通じて学ぶ手法のことです。例えば、ゲームで何度も失敗しながら、どの行動が良い結果につながるかを自分で発見していきます。シルバー氏はこの分野の世界的権威として知られています。

スーパーラーナーとは何か

Ineffable Intelligenceが開発を目指す「スーパーラーナー」は、人間が作成したデータに依存せず、自分自身の経験から知識とスキルを発見できるAIシステムです。現在主流の大規模言語モデル、例えばChatGPTやGeminiなどは、インターネット上の膨大な文章、書籍、ウェブサイトなど、人間が書いたテキストデータから学習しています。これに対してスーパーラーナーは、人間のデータを使わず、自ら試行錯誤を繰り返して学びます。同社のウェブサイトによれば、スーパーラーナーは「自分自身の経験からすべての知識を発見する」ことを目指しています。同社は野心的な目標を掲げており、「成功すれば、これはダーウィンの進化論に匹敵する科学的ブレークスルーになる。ダーウィンの法則がすべての生命を説明したように、我々の法則はすべての知能を説明し構築する」とウェブサイトで主張しています。シルバー氏自身も、Ineffable Intelligenceを「人生の仕事」と呼んでいます。

強化学習と大規模言語モデルの違い

強化学習と大規模言語モデルは、AIの学習方法において根本的に異なります。大規模言語モデルは、人間が書いた大量のテキストを読み込み、言葉のパターンや知識を吸収します。これは人間が本を読んで学ぶのに似ています。一方、強化学習は試行錯誤による学習です。AIは何かを試し、その結果が良ければ報酬を受け取り、悪ければペナルティを受けます。この繰り返しで、どの行動が良い結果につながるかを自分で発見します。例えば、ゲームをプレイするAIは、最初はランダムに動きますが、何千回、何万回とプレイするうちに、勝つための戦略を自分で編み出します。AlphaZeroは、囲碁のルールだけを教えられ、あとは自分自身と対戦を繰り返すことで、人間のプロ棋士が何千年もかけて築いた定石を超える戦略を数時間で発見しました。Ineffable Intelligenceは、この強化学習の原理を、ゲームだけでなくあらゆる知識とスキルの獲得に応用しようとしています。

できること・できないこと

スーパーラーナーが実現すれば、人間のデータに含まれるバイアスや誤りから自由なAIシステムが可能になります。例えば、現在の大規模言語モデルは、学習データに含まれる偏見や間違った情報をそのまま学習してしまう問題があります。スーパーラーナーは自分で試行錯誤するため、人間の先入観に縛られない新しい解決策を発見できる可能性があります。また、人間がまだ十分なデータを持っていない新しい問題領域でも、自ら学習して解決策を見つけられるかもしれません。科学研究や新薬開発など、人間の知識が限られている分野での応用が期待されます。

一方で、この技術にはまだ多くの課題があります。強化学習は、明確な目標と評価基準がある問題には有効ですが、目標が曖昧な現実世界の複雑な問題にどこまで適用できるかは未知数です。また、AlphaZeroがチェスや囲碁で成功したのは、ルールが明確で、勝敗がはっきりしているからです。日常生活の多くの問題は、何が「正解」なのか明確ではありません。さらに、強化学習には膨大な計算資源が必要です。AlphaZeroは数時間の学習で人間を超えましたが、その間に何百万回もの対局をシミュレーションしました。現実世界で同じことをするには、莫大なコストがかかります。Ineffable Intelligenceがこれらの課題をどう克服するかは、今後数年の開発にかかっています。

ロンドンがAIハブとして台頭

Ineffable Intelligenceの大型調達は、ロンドンがAI研究開発の中心地として台頭していることを示しています。これは主に、DeepMindが2014年にGoogleに買収された後もロンドンに拠点を維持し続けたことが大きな要因です。DeepMindは世界トップクラスのAI研究者を集め、多くの卒業生を輩出してきました。Ineffable Intelligenceの経営陣にも、複数の元DeepMind社員が参加すると報じられています。さらに、DeepMindの元主任研究員ティム・ロックテシェル氏が共同創業したRecursive Superintelligenceも、英国で設立され、5億ドルから10億ドルの調達を目指していると報じられています。また、チューリング賞受賞者で元Meta AI研究者のヤン・ルカン氏が共同創業したAMI Labsも、先月10.3億ドルを調達しました。アマゾン創業者ジェフ・ベゾス氏のAI研究所Project Prometheusも、Googleのロンドンにあるハブの近くにオフィススペースを確保する交渉中と報じられています。これらの動きは、シリコンバレーに集中していたAI開発の中心が、ロンドンにも広がりつつあることを示しています。

私たちへの影響

このニュースは、AI技術の開発者、投資家、そしてAIを利用するすべての人々に影響を与えます。短期的には、人間のデータに依存しない新しいAI開発アプローチが注目を集め、研究開発の方向性に影響を与えるでしょう。大規模言語モデルが主流の現在、強化学習ベースのアプローチが実用化されれば、AI業界の勢力図が変わる可能性があります。また、英国政府がSovereign AIファンドを通じて投資していることは、各国がAI開発を国家戦略として重視していることを示しています。

中長期的には、スーパーラーナーが成功すれば、人間のデータやラベル付けに依存しないAIシステムが実現し、データプライバシーの問題が軽減される可能性があります。また、人間がまだ解決策を見つけていない科学的・技術的問題に対して、AIが独自の解決策を発見できるようになるかもしれません。医療、材料科学、気候変動対策など、複雑な問題の解決が加速する可能性があります。一方で、人間の監督なしに学習するAIシステムは、予期しない行動を取るリスクもあります。

ただし、Ineffable Intelligenceはまだ創業から数カ月の企業であり、実際の製品やサービスはまだ発表されていません。大きな期待と資金が集まっていますが、技術的な実現可能性や実用化までの時間は不透明です。シルバー氏の過去の実績は印象的ですが、ゲームAIの成功が他の領域でも再現できるかは未知数です。今後の開発状況を注視する必要があります。

出典:DeepMind’s David Silver just raised $1.1B to build an AI that learns without human data(techcrunch.com)

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です