GoogleのAI「Gemma 4」が完全オープンソース化、スマホでもオフライン動作可能に

Googleが2026年4月2日、AI言語モデル「Gemma 4」を完全オープンソース化。Apache 2.0ライセンスで商用利用も自由に。スマートフォンやRaspberry Piでもオフライン動作が可能になり、プライバシー保護と低コスト運用を実現。

GoogleのAI「Gemma 4」が完全オープンソース化、スマホでもオフライン動作可能に

Googleは2026年4月2日、AI研究部門DeepMindが開発した言語モデル「Gemma 4」を、Apache 2.0ライセンスの下で完全オープンソース化すると発表しました。Apache 2.0ライセンスとは、ソフトウェアを商用・個人用を問わず自由に使用・改変・配布できる権利を与えるライセンスのことです。これにより、企業や開発者は制限なくGemma 4を自社製品に組み込んだり、改良したりできるようになります。

Gemma 4は、高性能サーバーから一般的なスマートフォン、さらにはRaspberry Piのような小型コンピューターまで、幅広いデバイスで動作するよう設計されています。特筆すべきは、インターネット接続なしで完全にオフラインで動作する点です。これまでのAIサービスの多くはクラウド(インターネット上のサーバー)に接続する必要がありましたが、Gemma 4はデバイス内だけで処理を完結できます。

この発表が重要な理由は、AIの利用方法に大きな選択肢が加わるからです。医療機関や金融機関など、顧客データを外部に送信できない業種でも、自社内でAIを活用できるようになります。また、ネットワーク接続が不安定な環境や、通信コストを抑えたい場面でも、高度なAI機能を利用できます。さらに、完全オープンソース化により、開発者コミュニティによる改良や新機能の追加も期待できます。

従来のGemmaシリーズは「オープン」と呼ばれていましたが、Googleが定めた利用規約の範囲内でしか使えませんでした。今回のGemma 4は真の意味でのオープンソースとなり、誰もが自由に使える公共財のような存在になります。これは、AI技術の民主化において大きな一歩と言えるでしょう。

Gemma 4の4つのモデルバリエーション

Gemma 4は、用途に応じて4種類のモデルが用意されています。「26B」と「31B」は、高性能サーバー向けの大規模モデルです。26Bは応答速度を重視した設計で、必要な部分だけを動かすことで素早く答えを返します。31Bは処理能力を最大限に引き出す設計で、複雑な問題にも対応できます。Bの前の数字は「パラメータ数」を表し、数字が大きいほど高性能ですが、その分多くの計算資源が必要になります。

一方、「E2B」と「E4B」は、スマートフォンやIoT機器(インターネットに接続された家電や産業機器)向けの軽量モデルです。パラメータ数はそれぞれ20億と40億で、限られた計算能力でも効率的に動作します。Googleによれば、これらのモデルはGoogle Pixelスマートフォン、Raspberry Pi(小型の教育用コンピューター)、Jetson Nano(AI開発用の小型デバイス)などで、完全にオフラインで、ほぼ遅延なく動作するとのことです。

すべてのモデルに共通する機能として、高度な推論能力(複数のステップを踏んで論理的に考える力)、自律的なワークフロー実行(他のツールやAPIと連携して自動的に作業を進める能力)、コード生成(プログラムコードを自動作成する機能)が挙げられます。特にコード生成機能がオフラインで使えることは、長時間のフライト中でもプログラミング作業を続けられることを意味します。

画像・動画・音声にも対応するマルチモーダル機能

Gemma 4の大きな特徴は、テキストだけでなく画像、動画、音声も理解できる「マルチモーダル」機能です。マルチモーダルとは、複数の種類のデータ(文字、画像、音声など)を同時に処理できる能力のことです。例えば、写真を見せて「この画像に何が写っていますか」と尋ねたり、動画を分析したりできます。

すべてのモデルが動画と画像をネイティブに処理でき、さまざまな解像度に対応します。OCR(光学文字認識、画像から文字を読み取る技術)やグラフの理解にも優れています。さらに、E2BとE4Bの軽量モデルには音声入力機能も搭載されており、音声認識や音声内容の理解が可能です。これにより、スマートフォン上で音声アシスタントのような機能を、インターネット接続なしで実現できます。

コンテキストウィンドウ(一度に処理できる情報量)も大幅に拡大されました。E2BとE4Bは128,000トークン(約10万語相当)、大規模モデルは256,000トークン(約20万語相当)のコンテキストウィンドウを持ちます。これは、長い文書やプログラムのソースコード全体を一度に読み込んで処理できることを意味します。また、140以上の言語に対応しており、グローバルな利用が可能です。

Apache 2.0ライセンスがもたらす自由

今回の発表で最も重要なのは、ライセンスの変更です。以前のGemmaシリーズは「Gemma利用規約」という独自の規約で提供されていました。この規約では、ダウンロードやローカル使用、改変は許可されていましたが、使用目的に制限があり、再配布にも条件がありました。つまり、「オープン」ではあっても「オープンソース」ではなかったのです。

Apache 2.0ライセンスは、ソフトウェア業界で広く使われている標準的なオープンソースライセンスです。このライセンスの下では、個人利用、商用利用、企業利用を問わず、ロイヤリティ(使用料)なしで自由にソフトウェアを使用できます。配布する場合は、Apache 2.0ライセンスのコピーと適切な帰属表示(誰が作ったかの明記)を含める必要がありますが、それ以外の制限はほとんどありません。

コードの改変や再配布も自由で、オリジナル版と改変版の両方を配布できます。興味深いのは特許関連の規定です。Apache 2.0ライセンスでは、ソフトウェアに関連する特許について自動的にライセンスが付与されるため、単にソフトウェアを使用しただけで特許侵害で訴えられる心配がありません。逆に、もし誰かがこのソフトウェアに関して特許侵害訴訟を起こした場合、その人は自動的にソフトウェアを使用する権利を失います。

Gemmaの普及状況と今後の展望

Gemmaシリーズは2024年2月に初めてリリースされて以来、急速に普及してきました。GoogleのDeepMind研究部門のクレマン・ファラベ副社長とオリビエ・ラコム製品マネージャーによれば、「初代のリリース以来、開発者はGemmaを4億回以上ダウンロードし、10万以上のバリエーション(改良版や派生版)からなる活気あるGemmaバースと呼ばれるエコシステムを構築してきました」とのことです。

これまでの26か月間で4億ダウンロードという数字は、AI開発者コミュニティにおけるGemmaの人気を示しています。しかし、以前は利用規約による制限があったため、完全に自由な利用はできませんでした。今回の完全オープンソース化により、採用率はさらに加速すると予想されます。

特に重要なのは、Gemma 4を製品やサービス、デバイスに組み込むことが法的に明確になった点です。企業は自社製品にGemma 4を搭載し、独自のAI機能を提供できるようになります。例えば、スマートフォンメーカーがGemma 4を内蔵した音声アシスタントを開発したり、工場の監視システムにAI判断機能を追加したりすることが、ライセンス料なしで可能になります。

できること・できないこと

Gemma 4により、これまでクラウドAIサービスに頼っていた多くの機能を、ローカル環境で実現できるようになります。例えば、医療機関では患者データを外部に送信せずに、診断支援や文書作成にAIを活用できます。製造業では、工場内のRaspberry Piにインストールして、リアルタイムで製造プロセスを監視し、異常を検知して即座に対応することが可能です。スマートフォンでは、インターネット接続がない場所でも、写真の説明生成、音声認識、翻訳などの機能が使えます。

開発者にとっては、オフラインでのコード生成機能が大きなメリットです。長距離フライト中や、セキュリティ上の理由でインターネット接続が制限された環境でも、AIアシスタントを使ってプログラミング作業を続けられます。また、Apache 2.0ライセンスにより、Gemma 4を組み込んだ商用製品を自由に開発・販売できるため、新しいビジネスチャンスが生まれます。

一方で、いくつかの制約もあります。軽量モデル(E2BとE4B)は、大規模モデルに比べて処理能力が限られているため、非常に複雑な推論や専門的な知識を要する質問には、十分な回答ができない場合があります。また、オフラインで動作するということは、最新情報へのアクセスができないことを意味します。リアルタイムのニュースや株価情報など、常に更新される情報を扱う用途には向いていません。さらに、スマートフォンやRaspberry Piで動作させる場合、バッテリー消費やストレージ容量の問題も考慮する必要があります。

私たちへの影響

このニュースは、AI技術を利用したい企業、開発者、そして一般ユーザーに、それぞれ異なる形で影響を与えます。企業にとっては、データプライバシーとコスト削減の両面でメリットがあります。顧客データを外部に送信せずにAI機能を提供できるため、医療、金融、法律など規制の厳しい業界でもAI導入のハードルが下がります。また、クラウドAIサービスの利用料を支払う必要がなくなるため、長期的なコスト削減につながります。

開発者にとっては、新しい製品やサービスを開発する自由度が大幅に増します。Apache 2.0ライセンスにより、Gemma 4を組み込んだアプリケーションを自由に配布・販売できるため、イノベーションが加速するでしょう。また、オープンソースコミュニティによる改良や拡張も期待でき、Gemma 4はさらに進化していく可能性があります。

一般ユーザーへの短期的な影響としては、スマートフォンアプリやIoTデバイスに、より高度なAI機能が搭載されるようになることが挙げられます。インターネット接続なしで使える音声アシスタント、写真整理アプリ、翻訳ツールなどが増えるでしょう。中長期的には、プライバシーを重視したAIサービスが主流になる可能性があります。自分のデータが外部サーバーに送信されることなく、デバイス内だけで処理されるため、プライバシー保護の観点から安心して利用できます。

ただし、注意すべき点もあります。オープンソース化により、悪意ある利用者が有害なコンテンツ生成や詐欺に悪用する可能性も高まります。Googleは「独自モデルと同じ厳格なインフラセキュリティプロトコルを適用している」と述べていますが、ダウンロード後の使用方法まで管理することはできません。また、ローカルで動作するAIは、クラウドベースのAIに比べて性能面で劣る場合があることも理解しておく必要があります。用途に応じて、クラウドAIとローカルAIを使い分ける判断力が求められるでしょう。

出典:Google’s Gemma 4 model goes fully open-source and unlocks powerful local AI – even on phones(www.zdnet.com)

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です