OpenAI DevDay 2025 第1回:今年のイベント全体像と新モデルの要点

サンフランシスコ湾に面したフォート・メイソンで、2025年10月6日にOpenAIの年次開発者会議「DevDay 2025」が開かれました。オンラインでは基調講演のアーカイブが視聴でき、現地には世界中から開発者が集まりました。公式の開催案内でも日付と会場は明記されており、今年は「作る」という行為そのものを再定義するような発表が続きました。(OpenAI)

会場の温度感を一言で言えば、「ChatGPTの中で、アプリもエージェントも当たり前に動く未来が始まった」という空気です。とくに注目を集めたのは、ChatGPTの会話の中でそのまま操作できる“アプリ”の導入予告と開発者向けのApps SDKの公開、そして動画生成の最新モデル「Sora 2」や、より高性能な言語モデル群の投入です。アプリとSDKはOpenAIの公式プロダクト発表として公開され、誰でもプレビューで触れる段階に入りました。(OpenAI)

一方で、プラットフォームの規模が大きく跳ね上がっていることも共有されました。独立系のライブブログでは、開発者が約400万人、ChatGPTの週次アクティブユーザーが8億人超、APIの処理規模は分速60億トークンという文脈で数字が紹介されています。外部メディアも「週次8億人超」を報じており、会場の熱量を裏付ける材料になっています。(Simon Willison’s Weblog)

今年の「新モデル」は何が新しいのか

DevDayというと毎年「新しいモデルの名前」が話題になりますが、名前そのものより大切なのは「何が、誰に、どう役立つのか」という実用視点です。今年は大きく三つの柱が目立ちました。ひとつめが動画と音声を含む“マルチモーダルの表現力”の進化、ふたつめが“応答の軽さとコスト”の改善、みっつめが“開発者が組み込むための扱いやすさ”です。

このうち表現力の代表例が「Sora 2」です。公式のアナウンスとシステムカードでは、物理的な挙動の整合性、現実感、そしてユーザー指示への忠実さが向上したと説明されています。映像と音の同期や、スタイルの幅の広さも打ち出されました。ここで重要なのは、単に「リアルな映像が作れる」という話ではなく、ユーザーが狙った指示に沿って動画の中身を細かく“操縦”しやすくなったという点です。動画生成は表現の自由度が高い一方で、意図した通りのショットや動きを出すには微妙な調整が必要です。Sora 2は、その調整のハンドルが増えて“仕事道具”に近づいた、と捉えると理解しやすいはずです。(OpenAI)

コストと軽さの文脈では、低遅延の音声対話向けに小型で廉価な「gpt-realtime mini」がAPIに登場しました。このモデルは高速なストリーミング入出力を想定し、ボイスボットや電話対応、リアルタイムの読み上げ・聞き取りのような用途で“待ち時間”を実用的なレベルまで縮めることが狙いです。報道各社も発表当日に相次いで取り上げ、ドキュメントも公開されています。複雑なことをじっくり考えるより、即応性が求められる場面に向けた“機動力重視”の選択肢、と考えると位置づけが腑に落ちます。(TechCrunch)

そして、言語モデルの“上限”を押し上げる方向では、より高性能なGPT-5系列の活用が話題になりました。OpenAIは夏の段階でGPT-5の導入を公表しており、DevDayの報道でも高性能版の提供に触れられています。ここで誤解してはいけないのは、「最上位モデルだけを使えば万能」という話ではないことです。たとえば長文の戦略立案やルールの解釈、複数資料の読み合わせのように“思考の工程”が長い仕事は上位モデルが光りますが、すべての業務で必要になるわけではありません。Webサイトの問い合わせ一次対応、音声の聞き取りと要約、簡易な推薦といった“薄く広い”仕事には、軽量モデルのほうが費用対効果が高いことが多いのです。(OpenAI)

安全性と社会的インパクトという視点

映像生成が一般化するにつれて、安全性や権利保護の議論も濃くなっています。Sora 2の登場後、著作権や肖像の扱い、透かし(ウォーターマーク)の実効性といった論点がメディアで取り上げられ、OpenAI側もコントロール機能やポリシー運用の強化を示しています。動画の“力”が増せば増すほど、誤情報の拡散や不適切利用のリスクも大きくなるため、モデルの性能向上と同時に、使い方を縛る仕組みや透明性の確保が求められます。これは技術の話であると同時に、社会のルールづくりの話でもあります。(The Verge)

インフラの現実:計算資源をどう確保するか

今年のDevDayの裏側で、極めて実務的な“土台”のニュースも動きました。OpenAIはAMDと戦略提携を結び、数年かけて合計6ギガワット規模のGPUを導入するという発表を行っています。初期の1ギガワットは2026年後半にMI450シリーズでの導入開始という具体的なスケジュールが公開されました。生成AIの品質と供給を支えるのは結局ハードウェアと電力であり、モデルの性能や価格が今後どう変わるのかは、この種の長期契約に強く影響されます。(OpenAI)

ことばの辞典:この記事で出てきた専門用語を、短く正確に

Sora 2は、テキストの指示や静止画から、音声と同期した動画を生成する最新モデルの名前です。従来よりも物理挙動や画のリアリティが高く、ユーザーの細かな指示に従いやすいよう設計されています。映像制作の“下絵”を一瞬で作る、というより、狙ったショットを出すために“操縦”できる余地が広がったという理解が実務的です。(OpenAI)

gpt-realtime miniは、音声の聞き取りと返答をできるだけ速く行うための“小型音声モデル”です。通話や店頭の音声案内といったリアルタイム性が重要な場面で、遅延を小さく、費用も抑えて導入できるように設計されています。(TechCrunch)

GPT-5は、2025年にOpenAIが導入した最新世代の言語モデルの総称です。長い推論や複雑な指示の解釈が必要な仕事に強みがあり、同年夏の公式発表以降、開発者向けの機能更新や派生モデル(コーディング特化のGPT-5-Codexなど)が順次案内されています。(OpenAI)

第2回への橋渡し:ChatGPTの中で動く「アプリ」とは何者か

今回の記事では全体像と新モデルの意味を整理しました。次回は、多くの読者にとって一番身近になるであろうテーマ、つまり「ChatGPTの会話の中でそのまま操作できるアプリ」と、その仕組みを作るためのApps SDKを取り上げます。公式発表が示すのは、これは過去の“プラグイン”の焼き直しではなく、UIを備えた小さなWeb体験を会話に溶け込ませる新しい設計思想だという点です。アプリはいつ、どの国で、どのユーザーに届くのか。どんなブランドが最初に使えるのか。何が安全で、何が禁止されるのか。こうした実用上の疑問を、一般の利用シーンに置き換えながら丁寧に解説していきます。(OpenAI)


※本記事は、OpenAI公式の発表ページ、当日のライブブログ、主要メディア報道を突き合わせて執筆しています。開催情報は公式告知、規模感はライブブログと報道、モデルとSDKは公式プロダクト発表、インフラは公式およびAMDのニュースリリースに基づいています。(OpenAI)

次回(第2回)は、この「アプリ」とApps SDKを、初心者の方でも実像がつかめるように、会話画面の体験イメージから順に解きほぐしていきます。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です