Anthropicは2025年11月24日、最上位モデル「Claude Opus 4.5」を発表した。11月はGoogleがGemini 3 Pro、OpenAIがGPT-5.1を相次いで発表しており、AI業界の競争が激化している。Opus 4.5はコーディング性能で80.9%のスコアを記録し、従来の価格から3分の1への値下げも実施した。
AI企業の新モデル発表ラッシュ
2025年11月は、主要AI企業が集中して次世代モデルを発表した。11月18日にGoogleがGemini 3 Proを発表した。11月19日にOpenAIがGPT-5.1を発表した。Anthropicは11月24日にClaude Opus 4.5を発表した。
各社の発表が集中した背景には、年末のエンタープライズ契約更新時期がある。各社は2026年に向けた開発者エコシステムの確保を目指している。
Anthropicは2025年に製品展開を加速させてきた。5月にClaude 4、8月にOpus 4.1、9月にSonnet 4.5、10月にHaiku 4.5を投入した。Opus 4.5はこのシリーズの完結版となる。
Claude Opus 4.5の主要機能
Opus 4.5の最大の革新は「Effort Parameter(努力パラメータ)」の導入である。ユーザーはAPIリクエスト時にlow、medium、highの3段階から設定を選択できる。Low設定では速度とコスト効率を優先する。High設定では複雑な推論とコーディングタスクに対し、徹底的な思考と検証を行う。
Anthropicの内部ベンチマークでは、High設定でトークン数を48%削減しつつ、SWE-bench Verifiedのスコアを4.3ポイント向上させた。ユーザー側でコストと精度のトレードオフを管理できる点は、エンタープライズ利用における予見可能性を高める。
長時間実行エージェントのための機能も強化されている。従来のモデルでは破棄されていたアシスタントの思考プロセスが、デフォルトでコンテキスト内に保持される。コンパクション技術により、長時間のタスク実行に伴うコンテキスト情報を意味を損なわずに圧縮する。
Computer Use機能も進化した。新たに「ズームツール」がサポートされ、画面上の特定領域を拡大して詳細を確認できる。OSWorldベンチマークで66.3%のスコアを記録し、Sonnet 4.5(61.4%)やOpus 4.1(44.4%)から明確に進歩した。
競合モデルとの比較
SWE-bench Verifiedは、実際のGitHub上の課題を解決できるかを測定するコーディングベンチマークである。Opus 4.5は80.9%のスコアを記録した。GPT-5.1 Codex Maxは77.9%、Claude Sonnet 4.5は77.2%、Gemini 3 Proは76.2%となっている。Opus 4.5は初めて80%の壁を突破した。
価格面では大幅な改定が行われた。Opus 4.5は入力$5.00/出力$25.00となった。従来のOpus 3は入力$15/出力$75だったため、約3分の1の価格設定となった。GPT-5.1は入力$1.25/出力$10.00、Gemini 3 Proは入力$2.00/出力$12.00である。Opus 4.5は値下げされたが、依然として競合より高額である。
安全性においては、Opus 4.5は他社を圧倒する堅牢性を示している。Gray Swanによる独立テストで、Opus 4.5の攻撃成功率は4.7%であった。Gemini 3 Proは12.5%、GPT-5.1は21.9%である。金融機関や医療機関など、セキュリティ要件の厳しい業界において、この堅牢性は決定的な採用要因となる可能性がある。
開発者の役割変化
Opus 4.5のリリースに伴い、一部では「ソフトウェアエンジニアリングは解決された」という意見も出ている。Opus 4.5はAnthropicの採用試験で、過去のどの候補者よりも高いスコアを記録した。
ただし、実際の開発現場からは慎重な意見も根強い。「シンプルなアプリなら可能だが、レガシーシステムの保守は別次元」という声や、「テストの半分は失敗した」という報告もある。
現時点では「開発者の完全な代替」ではなく、「開発プロセスの質的転換」が進行していると見るべきである。開発者の役割はコードを書く作業から、AIが書いたコードの仕様策定、レビュー、システム全体の設計へとシフトしている。
クラウドプラットフォームとの連携
Opus 4.5はリリースと同時に、主要なクラウドプラットフォームで利用可能となった。Amazon Bedrockではクロスリージョン推論により、ピーク時のスループットを確保している。Google Vertex AIでは即日利用可能となった。Microsoft Azure (Foundry)を通じても提供が開始された。
開発者向けツールも充実している。Claude Agent SDKは、Anthropic自身がClaude Codeの構築に使用しているインフラをSDKとして公開したものである。GitHub CopilotでもOpus 4.5が利用可能となり、複雑なリファクタリングや計画立案での活用が推奨されている。
今後の見通し
Claude Opus 4.5のリリースは、AIモデルの競争が「チャットボットの賢さ」から「自律型エージェントの実用性」へと移行したことを明確にした。SWE-bench 80.9%というスコアと、攻撃成功率4.7%という堅牢性は、エンタープライズ利用における新たな基準となった。
2026年に向けて、企業は「AIをどう使うか」から「AIエージェントといかに協働し、管理するか」という課題に直面する。人間は、AIに対して指示を出すだけでなく、AIが作成した計画を承認し、その結果に責任を持つ「監督者」としての役割を求められる可能性がある。
GoogleとOpenAIも次々と新モデルを投入しており、AI開発競争は今後も激しさを増す見込みである。BKK IT Newsとしては、コスト、性能、セキュリティの3つの要素を総合的に評価し、自社の用途に適したモデルを選択することが望ましいと考える。
参考記事リンク
- Introducing Claude Opus 4.5 – Anthropic
- Claude Opus 4.5 now in Amazon Bedrock | Artificial Intelligence – AWS
- Introducing Claude Opus 4.5 in Microsoft Foundry | Microsoft Azure Blog
- Claude Opus 4.5 on Vertex AI | Google Cloud Blog
- Estimating AI productivity gains from Claude conversations – Anthropic


