Anthropicが2026年2月17日、中型AIモデル「Sonnet 4.6」を発表。コーディング性能と指示理解能力が向上し、100万トークンの長文処理が可能に。無料・有料プラン利用者のデフォルトモデルとして提供開始。
Anthropic、中型AIモデル「Sonnet 4.6」発表―100万トークン処理と性能向上を実現
米国のAI企業Anthropicは2026年2月17日、中型AIモデル「Claude Sonnet 4.6」の新バージョンを発表しました。同社は約4カ月ごとにモデルを更新する方針を掲げており、今回の発表もそのスケジュール通りの展開となります。Sonnet 4.6は、プログラミング支援、指示の理解、コンピュータ操作の3つの分野で大幅な性能向上を実現しました。特に注目すべきは、一度に処理できる文章量を示すコンテキストウィンドウが100万トークンに拡大された点です。これは従来のSonnetシリーズで最大だった容量の2倍に相当します。この容量があれば、プログラムのソースコード全体、長文の契約書、数十本の研究論文を一度のリクエストで処理できるようになります。Sonnet 4.6は、Anthropicの無料プランおよび有料プラン利用者にとってのデフォルトモデル、つまり標準的に使われるモデルとして提供されます。このニュースは、AI技術を日常的に活用する開発者やビジネスユーザーにとって、より高度な作業が可能になることを意味します。
Sonnet 4.6の主な改善点と新機能
Anthropicが公式発表で強調したのは、3つの主要分野における性能向上です。第1にコーディング能力の向上があります。これは、プログラムコードの生成、デバッグ、最適化といった開発者向けの機能が強化されたことを意味します。第2に指示理解能力の改善です。ユーザーが出す複雑な指示や曖昧な要求をより正確に理解し、意図通りの結果を返せるようになりました。第3にコンピュータ操作機能の強化です。これは、AIがコンピュータ画面を認識し、マウスやキーボード操作を自動化する能力を指します。
最も大きな変更点は、コンテキストウィンドウの拡大です。コンテキストウィンドウとは、AIが一度に読み込んで処理できる文章の量のことです。トークンとは文章を細かく分割した単位で、日本語では約1トークンが1文字程度に相当します。100万トークンという容量は、日本語で約100万文字、つまり長編小説数冊分に相当する膨大な量です。この拡大により、大規模なプログラムプロジェクト全体の分析、複数の法律文書の比較検討、大量の学術論文の要約といった作業が一度のやり取りで完結できるようになります。
背景と経緯
今回のSonnet 4.6発表は、わずか2週間前に発表された上位モデル「Opus 4.6」に続くものです。Anthropicは、性能と用途の異なる3つのモデルシリーズを展開しています。最上位のOpusは最高性能を誇りますが処理コストが高く、中位のSonnetは性能とコストのバランスが取れており、下位のHaikuは高速で低コストという特徴があります。Sonnetは多くのユーザーにとって最も使いやすいバランス型モデルとして位置づけられています。
Anthropicは約4カ月ごとにモデルを更新する方針を明確にしており、今回の発表もその計画に沿ったものです。この定期的な更新サイクルは、競合他社との技術競争が激化する中で、常に最新の性能を提供し続けるための戦略です。発表によれば、最下位モデルのHaikuの更新版も数週間以内に発表される見込みです。これにより、全モデルシリーズが最新世代に揃うことになります。
ベンチマーク性能の詳細
Anthropicは今回の発表で、複数の業界標準ベンチマークテストにおいて記録的な高得点を達成したと報告しています。ベンチマークテストとは、AIモデルの性能を客観的に測定するための標準化された試験のことです。
特に注目すべき成果として、OS Worldというコンピュータ操作能力を測るテストと、SWE-Benchというソフトウェア工学の実践的な問題解決能力を測るテストで最高記録を達成しました。しかし最も印象的なのは、ARC-AGI-2というテストでの60.4%という得点です。ARC-AGI-2とは、人間特有の知能、特に新しい状況への適応力や抽象的思考能力を測定するために設計されたテストです。このテストは非常に難易度が高く、多くのAIモデルが苦戦する分野として知られています。
60.4%という得点は、同クラスの競合モデルの多くを上回る成績です。ただし、上位モデルのOpus 4.6、GoogleのGemini 3 Deep Think、OpenAIのGPT 5.2の改良版といった最高性能モデルには及びませんでした。これは、Sonnetが中型モデルとして設計されていることを考えれば妥当な結果と言えます。重要なのは、より小型で処理コストの低いモデルでありながら、高い性能を実現している点です。
できること・できないこと
Sonnet 4.6により、開発者やビジネスユーザーは従来よりも高度な作業を効率的に行えるようになります。例えば、プログラマーは数万行に及ぶソースコード全体をAIに読み込ませ、バグの発見や最適化の提案を一度に受けられます。法務担当者は複数の契約書を同時に分析し、矛盾点や重要条項を抽出できます。研究者は数十本の学術論文を一括で要約し、研究動向を把握できます。コンピュータ操作機能の強化により、定型的な画面操作の自動化も可能になります。
一方で、いくつかの制約も存在します。100万トークンという大容量は画期的ですが、処理時間とコストは入力量に比例して増加します。そのため、本当に必要な場合にのみ大量のデータを入力することが推奨されます。また、ARC-AGI-2での60.4%という得点は高水準ですが、人間の平均的な成績には届いていません。これは、完全に人間と同等の柔軟な思考や創造性はまだ実現できていないことを示しています。最上位モデルのOpus 4.6と比較すると、極めて複雑な推論や高度な専門知識を要する作業では性能差が出る可能性があります。今後数カ月の間に、ユーザーからのフィードバックを基にした改善が進められるでしょう。
私たちへの影響
このニュースは、AIツールを業務や学習に活用している個人や企業に直接的な影響を与えます。Sonnet 4.6が無料プランおよび有料プランのデフォルトモデルになることで、追加設定なしに自動的に最新の性能を利用できるようになります。これは、既存ユーザーにとって即座に恩恵を受けられる変更です。
短期的な影響としては、プログラミング支援の質が向上し、開発効率が改善されることが期待できます。特にコードレビューやデバッグ作業において、より的確な提案を受けられるようになるでしょう。文書作成や分析業務においても、大量の資料を一度に処理できることで作業時間の大幅な短縮が見込めます。中長期的には、AIアシスタントがより複雑な業務を代行できるようになり、人間はより創造的で戦略的な仕事に集中できる環境が整うと予測されます。
ただし、注意すべき点もあります。AIの性能向上は便利さをもたらす一方で、生成された内容の正確性を人間が検証する責任は変わりません。特に法律文書や重要な意思決定に関わる分析では、AIの出力を鵜呑みにせず、専門家による確認が不可欠です。また、100万トークンという大容量処理は便利ですが、処理コストも考慮する必要があります。有料プランでは使用量に応じた課金が発生するため、費用対効果を見極めながら活用することが重要です。
