OpenAIが2025年12月、AI開発ツール「Codex」を自己改善に活用していることを明らかにした。同社エンジニアの大多数がCodexを使用し、ツール自体の大部分もCodexによって開発されている。AI開発の新たな段階を示す事例として注目される。
OpenAIのAIコーディングツール「Codex」、自分自身の改善に活用される
2025年12月、OpenAIは同社のAIコーディングエージェント「Codex」が、自身の開発と改善に広く使われていることを明らかにしました。Codexの製品責任者であるアレクサンダー・エンビリコス氏は「Codexの大部分はCodex自身によって構築されている」と述べ、AIツールが自己改善のサイクルに入っていることを示しました。Codexは2025年5月に現在の形でリサーチプレビューとして公開されたクラウドベースのソフトウェア開発エージェントで、機能の実装やバグ修正、プルリクエストの作成などを自動で行います。OpenAI社内では、エンジニアの大多数がCodexを日常的に使用しており、人間の同僚と同じようにタスクを割り当てています。この開発手法は、1960年代に手作業で設計された集積回路が、やがてコンピュータ支援設計ソフトウェアを生み出し、さらに複雑な回路設計を可能にした歴史と重なります。AI開発における新たな段階として、技術業界で注目を集めています。
Codexとは何か
Codexとは、OpenAIが開発したAIコーディングエージェントのことです。コーディングエージェントとは、プログラムのコードを書いたり、バグを修正したり、新しい機能を追加したりする作業を自動で行うAIツールを指します。例えば、開発者が「ユーザーログイン機能を追加して」と指示すると、Codexが必要なコードを書いて提案してくれるのです。
Codexは、ユーザーのコードリポジトリ(プログラムのコードを保管する場所)に接続された安全な環境で動作します。複数のタスクを同時並行で処理できるため、効率的な開発が可能です。OpenAIは、ChatGPTのウェブインターフェース、コマンドラインインターフェース(CLI)、そしてVS Code、Cursor、Windsurfといった統合開発環境の拡張機能を通じてCodexを提供しています。
「Codex」という名前自体は、2021年にGPT-3をベースにしたOpenAIのモデルに遡ります。このモデルはGitHub Copilotのタブ補完機能を支えていました。エンビリコス氏によると、社内では「code execution(コード実行)」の略だと噂されているそうです。OpenAIは、この新しいエージェントを、一部は既に退社したメンバーによって作られた初期の成功と結びつけたかったのです。
自己改善するAIツールの仕組み
OpenAI社内では、Codexが自分自身の開発に深く関わっています。エンビリコス氏は「Codexの大部分はCodex自身によって構築されており、ほぼ完全に自己改善に使われている」と説明しました。これは単なるコード生成にとどまりません。Codexは自身のトレーニング実行を監視し、ユーザーフィードバックを処理して、次に何を構築すべきかを「決定」します。
具体的には、Codexが自身のトレーニング実行のための研究用ハーネス(テスト環境)の多くを書いています。OpenAIは、Codexに自身のトレーニング実行を監視させる実験も行っています。さらに、OpenAIの従業員は、Linearなどのプロジェクト管理ツールを通じてCodexにチケットを送信し、人間の同僚に仕事を割り当てるのと同じ方法でタスクを割り当てることができます。
この再帰的なループ、つまりツールを使ってより良いツールを構築するという手法は、コンピューティング史に深い根を持っています。1960年代、エンジニアは最初の集積回路を紙の上に手作業で設計し、その図面から物理的なチップを製造しました。それらのチップが最初の電子設計自動化(EDA)ソフトウェアを実行するコンピュータを動かし、そのソフトウェアによって人間が手作業で設計するには複雑すぎる回路の設計が可能になったのです。OpenAIによるCodexの使用は、同じパターンに従っているように見えます。各世代のツールが次の世代に引き継がれる能力を生み出しているのです。
社内での急速な普及と成果
OpenAI社内でのCodexの採用は急速に進んでいます。エンビリコス氏によると、OpenAIのエンジニアの大多数が現在Codexを定期的に使用しています。同社は、外部の開発者が自由にダウンロード、追加提案、修正できるオープンソース版のCLIと同じものを使用しています。「私たちのチームについて本当に気に入っているのは、私たちが使用しているCodexのバージョンが文字通りオープンソースのリポジトリであることです。機能が追加される別のリポジトリはありません」とエンビリコス氏は述べました。
外部開発者の間でも、Codexの使用は急増しています。2025年8月にOpenAIがGPT-5と共にインタラクティブなCLI拡張機能を提供した後、外部開発者の間でのCodex使用量は20倍に跳ね上がりました。2025年9月15日には、OpenAIがエージェント型コーディングに最適化されたGPT-5の特殊版であるGPT-5 Codexをリリースし、採用がさらに加速しました。
Codexの社内での影響を示す最も劇的な例は、OpenAIのSora Androidアプリの開発です。エンビリコス氏によると、このアプリはゼロから4人のエンジニアによって開発されました。「構築に18日かかり、合計28日でアプリストアに出荷しました」と彼は述べました。エンジニアたちは既にiOSアプリとサーバー側のコンポーネントを持っていたため、Androidクライアントの構築に集中しました。彼らはCodexを使ってアーキテクチャを計画し、異なるコンポーネントのサブプランを生成し、それらのコンポーネントを実装しました。
チームメイトとしてのAI
Codexチームのデザイナーであるエド・ベイズ氏は、このツールが自身のワークフローをどのように変えたかを説明しました。Codexは現在、Linearなどのプロジェクト管理ツールやSlackなどのコミュニケーションプラットフォームと統合されており、チームメンバーがAIエージェントに直接コーディングタスクを割り当てることができます。「Codexを追加して、基本的にCodexに問題を割り当てることができるようになりました。Codexは文字通りワークスペースのチームメイトです」とベイズ氏は述べました。
この統合により、誰かがSlackチャンネルにフィードバックを投稿したとき、Codexをタグ付けして問題の修正を依頼できます。エージェントはプルリクエストを作成し、チームメンバーは同じスレッドを通じて変更をレビューし、反復することができます。「基本的に同僚のようなものを近似していて、あなたが働く場所ならどこでも現れます」とベイズ氏は言いました。
ベイズ氏にとって、Codexのインターフェースのビジュアルデザインとインタラクションパターンに取り組んでいる彼にとって、このツールは仕様をエンジニアに引き渡すのではなく、直接コードを提供することを可能にしました。「より多くのレバレッジを得られます。スタック全体にわたって作業し、基本的により多くのことができるようになります」と彼は述べました。OpenAIのデザイナーは現在、フロントエンド機能のプロトタイプを作成し、それを本番環境に出荷しています。
できること・できないこと
Codexにより、ソフトウェア開発の多くの側面が自動化されます。例えば、新しい機能の実装、バグの修正、コードのリファクタリング(既存のコードを改善すること)、プルリクエストの作成といった作業が可能です。OpenAI社内の事例では、Androidアプリを28日間で完成させるなど、開発速度の大幅な向上が実現しています。また、デザイナーがエンジニアの助けを借りずに直接コードを書けるようになるなど、職種の垣根を越えた協働も可能になっています。
一方で、複雑で成熟したコードベースでの作業には課題もあります。2025年7月に発表されたMETRの研究では、経験豊富なオープンソース開発者が複雑なコードベースでAIツールを使用した場合、実際には19パーセント遅くなることが示されました。ただし、研究者たちは、AIはよりシンプルなプロジェクトではより良いパフォーマンスを発揮する可能性があると指摘しています。つまり、Codexは比較的単純なタスクや新規プロジェクトでは効果的ですが、大規模で複雑なシステムの深い部分を扱う場合には、まだ人間の専門知識が必要とされるのです。
また、Codexが生成するコードは必ずしも完璧ではありません。人間によるレビューと修正が依然として重要です。OpenAI社内でも、Codexが作成したプルリクエストはチームメンバーによってレビューされ、必要に応じて修正されています。AIツールは開発を加速しますが、最終的な品質保証と意思決定は人間が行う必要があります。
私たちへの影響
このニュースは、ソフトウェア開発者とテクノロジー業界全体に大きな影響を与えます。Codexのような自己改善するAIツールの登場は、ソフトウェア開発の方法が根本的に変わりつつあることを示しています。
短期的な影響については、開発者の生産性向上が期待されます。OpenAIの事例が示すように、適切に使用すれば、開発時間を大幅に短縮できる可能性があります。また、デザイナーやプロダクトマネージャーなど、従来はコーディングを専門としていなかった職種の人々も、より直接的に製品開発に関わることができるようになるでしょう。これにより、アイデアから実装までのサイクルが速くなり、イノベーションが加速する可能性があります。
中長期的な影響としては、ソフトウェア開発の役割そのものが変化していく可能性があります。開発者は単にコードを書くだけでなく、AIツールを効果的に指示し、その出力をレビューし、全体的なアーキテクチャを設計する役割により重点を置くようになるかもしれません。また、AIツールが自己改善のサイクルに入ることで、技術の進歩がさらに加速する可能性があります。
ただし、いくつかの注意点があります。METRの研究が示すように、複雑なタスクではAIツールが必ずしも効率を向上させるとは限りません。また、AIが生成したコードの品質、セキュリティ、保守性については、引き続き人間による慎重な評価が必要です。さらに、AIツールへの過度な依存は、開発者の基礎的なスキルの低下につながる可能性もあり、バランスの取れたアプローチが求められます。
