AI画像・動画生成ツールのComfyUIが、2025年4月に3000万ドルの資金調達を実施し、企業価値5億ドルに到達。クリエイターがAI生成コンテンツを細かく制御できるノードベースのツールとして、400万人以上のユーザーを獲得しています。
ComfyUI、企業価値5億ドルに到達―AI生成コンテンツの精密制御ツールとして急成長
2025年4月24日、AI画像・動画生成ツールを提供するComfyUIが、3000万ドル(約45億円)の資金調達を完了し、企業価値5億ドル(約750億円)に到達したと発表しました。この資金調達ラウンドは、Craft Venturesが主導し、Pace Capital、Chemistry、TruArrowなどの投資家が参加しました。ComfyUIは、拡散モデルと呼ばれるAI技術を使った画像、動画、音声の生成において、クリエイターが細かく制御できるノードベースのワークフローを提供しています。拡散モデルとは、ノイズから徐々に画像や動画を生成するAI技術のことです。MidjourneyやChatGPTのような一般的なAIツールでは、プロンプト(指示文)を入力すると結果の60~80%は希望通りになるものの、残りの20%を修正しようとすると全体が変わってしまう問題がありました。ComfyUIは、生成プロセスの各段階を個別に制御できるため、プロの映像制作者、アニメーター、広告クリエイター、工業デザイナーなどから支持を集め、現在400万人以上のユーザーを抱えています。
ComfyUIの資金調達と企業価値の詳細
ComfyUIは今回、Craft Venturesが主導する3000万ドルの資金調達ラウンドを完了しました。この調達により、同社の企業価値は5億ドルと評価されています。今回の調達には、Pace Capital、Chemistry、TruArrowといった投資家が参加しました。
これは同社にとって2回目の大型資金調達です。2024年後半には、Chemistry Ventures、Cursor Capital、VercelファウンダーのGuillermo Rauchなどから1900万ドルのシリーズA資金を調達していました。わずか数カ月で企業価値が大幅に上昇したことは、AI生成コンテンツの制御ツールに対する市場の強い需要を示しています。
ComfyUI誕生の背景と経緯
ComfyUIは、2023年に拡散モデルが登場した直後、オープンソースプロジェクトとして始まりました。当時、MidjourneyやOpenAIのDALL-Eといった初期の画像生成AIは、まだ機能が不十分で、手に指を6本描いてしまうような重大なミスを頻繁に起こしていました。
これらの制約に対処するため、プロジェクトの創設者たちは、生成プロセスの各段階をクリエイターが細かく制御できるモジュール式のフレームワークを開発しました。このツールはクリエイティブ専門家の間で大きな支持を集め、最終的に正式なスタートアップ企業へと発展しました。
共同創設者でCEOのYoland Yan氏は、「一般的なプロンプトベースのソリューション、例えばMidjourneyやChatGPTでは、何かを依頼すると60~80%は希望通りになります。しかし、残りの20%を変更しようとすると、スロットマシンのようなものです」と説明しています。プロンプトでモデルに小さな変更を指示すると、すでに完璧だった部分まで上書きされ、まったく異なる出力結果になってしまう問題があるのです。
ノードベースのワークフローとは何か
ComfyUIの最大の特徴は、ノードベースのインターフェースです。ノードとは、処理の各段階を表す小さな箱のようなもので、これらを線でつなぐことで処理の流れを作ります。例えば、音楽制作ソフトや映像編集ソフトで使われる仕組みと似ています。
具体的には、「画像のスタイルを決めるノード」「色調を調整するノード」「細部を追加するノード」といった個別の処理を、クリエイターが自由に組み合わせることができます。これにより、生成プロセスの特定の部分だけを変更し、他の部分はそのまま維持することが可能になります。
Yan氏は、「基盤モデルのプロンプトボックスでは、そのメッセージを簡単に伝えることができません」と述べています。通常のAIツールでは文章で指示するしかありませんが、ComfyUIでは視覚的に処理の流れを組み立てられるため、より正確な制御が可能になるのです。
できること・できないこと
ComfyUIを使うことで、AI生成コンテンツの品質を細かく制御できます。例えば、映像制作では特定のキャラクターの表情だけを変更しながら背景や構図はそのまま維持したり、広告制作では商品の配置を微調整しながら全体の雰囲気を保ったりすることが可能です。工業デザインの分野では、製品の特定の部分だけを変更して複数のバリエーションを効率的に作成できます。
現在、ComfyUIは画像、動画、音声の生成に対応しており、視覚効果、アニメーション、広告、工業デザインなどの分野で使われています。スタジオの求人情報には「ComfyUIアーティスト」や「ComfyUIエンジニア」という職種が掲載されるほど、業界で必須のツールになっています。
一方で、ComfyUIを効果的に使うには、ノードベースのワークフローに慣れる必要があります。初心者にとっては、MidjourneyやChatGPTのように文章で指示するだけのツールよりも学習コストが高いと言えます。また、基盤となる拡散モデル自体の性能に依存するため、モデルが対応していない表現は実現できません。
私たちへの影響
このニュースは、クリエイティブ業界で働く人々、特に映像制作者、デザイナー、アニメーターに大きな影響を与えます。AI生成コンテンツが普及する中で、品質を細かく制御できるツールの重要性が高まっているためです。
短期的な影響としては、ComfyUIのようなツールを使いこなせるスキルが、クリエイティブ業界での競争力になります。すでに求人情報に「ComfyUI」のスキルが記載されるようになっており、この傾向は今後さらに強まるでしょう。企業にとっては、AI生成コンテンツの品質管理がより容易になり、制作コストの削減と品質向上の両立が可能になります。
中長期的な影響としては、AI生成コンテンツの品質が向上し、プロフェッショナルな用途での利用が加速すると予測されます。Yan氏は「AIが生成した低品質なコンテンツがあふれる世界では、人間が関与するComfyUIのようなアプローチが最終的に多くの注目を集めるでしょう」と述べています。完全自動化ではなく、人間の創造性とAIの効率性を組み合わせたハイブリッドなアプローチが主流になる可能性があります。
ただし、このようなツールの普及により、クリエイターに求められるスキルセットが変化することにも注意が必要です。従来の創造性に加えて、AIツールを効果的に使いこなす技術的な知識も求められるようになるでしょう。
