新モデル「Claude Haiku 4.5」公開 前世代上位モデル並みの性能を1/3コストで提供

高速処理と低コスト運用を両立 開発者や企業の生産性向上を狙う

Anthropicは2025年10月15日、同社のAIモデル「Claude」シリーズの中で最も軽量なモデル「Claude Haiku」の最新版となる「Claude Haiku 4.5」を発表した。
軽量モデルながら、前世代の上位モデル「Claude Sonnet 4」をわずかに上回るコーディング性能を示している。

ソフトウェア開発ベンチマーク「SWE-bench Verified」(公式発表)によると、Claude Haiku 4.5の課題解決率は73.3%で、前世代のSonnet 4(72.7%)をわずかに上回った。一方、上位モデルSonnet 4.5(77.2%)との差は約3.9ポイントとなった。
ソフトウェア開発ベンチマーク「SWE-bench Verified」(公式発表)によると、Claude Haiku 4.5の課題解決率は73.3%で、前世代のSonnet 4(72.7%)をわずかに上回った。 一方、上位モデルSonnet 4.5(77.2%)との差は約3.9ポイントとなった。

今回の発表で特に注目を集めたのは、その卓越したコストパフォーマンスだ。
Anthropicは公式発表で、「5カ月前まではClaude Sonnet 4が最先端モデルでした。現在は、Claude Haiku 4.5が同等のコーディング性能を持ちながら、速度は2倍以上、コストは3分の1を実現しています」と述べている。

Cloud Haiku 4.5 公式発表ページ

Cloud Haiku 4.5 システムカード(PDF)

「Claude Haiku 4.5」が、GitHub Copilot向けにパブリックプレビューとして公開

Haiku 4.5は、リアルタイム性や低遅延(レイテンシ)の求められるチャット支援、ペアプログラミング、カスタマーサポートなどの用途に適しており、従来モデルに比べて応答速度が大幅に向上している。

また、API価格は前世代のSonnet 4の約3分の1に設定されており、同等の性能をより低コストで利用できる点も大きな特徴だ。

――ここからは『Deep Insider Brief』恒例の“ひと言コメント”として、今回の発表を通じて見えてきた技術動向をもう少し掘り下げていきたい。

開発者は、Claude CodeAnthropic公式API に加えて、GitHub CopilotAmazon BedrockGoogle Cloud Vertex AI などの主要プラットフォーム上でも、Claude Haiku 4.5 を従来の Haiku 3.5Sonnet 4 の代替モデルとして利用できる。

今回の発表では、速度や価格以外にも開発者が注目すべき新要素が複数含まれている。
その中から主なポイントを、以下に簡潔にまとめて紹介する。

■ 性能の向上

「Claude Haiku 4.5」は、前世代モデル「Haiku 3.5」と比較して推論力と回答精度が向上している。
政治的バイアス評価では、上位モデルである「Sonnet 4」や「Opus 4.1」を上回る結果を示した。

■ 機能性の改善

応答前に一定の「思考時間」を設ける**「拡張思考モード」を搭載し、より深い推論が可能になった。
また、アプリ操作やファイル編集などを実行できる
「コンピュータ利用」機能も強化。これにより「Claude for Chrome」などのアプリケーションがさらに実用的になっている。
加えて、小型モデルながら
複数のサブタスクを並列処理**でき、高速プロトタイピングからマルチエージェント開発まで幅広い用途に対応する。

■ 安全性の強化

安全性評価では、Haiku 3.5と比較して**「人にとって望ましくない振る舞い(Misaligned behavior)」が減少**。
さらに「Sonnet 4.5」や「Opus 4.1」と比べても統計的に有意に低いスコアを記録した。
また、化学・生物・放射能・核(CBRN)分野におけるリスクが限定的と判断され、**「AI Safety Level 2(ASL-2)」**として公開。
これは上位モデルSonnet 4.5よりも制約の緩い運用レベルに位置づけられる。


価格設定(Anthropic Claude API)

「Haiku 4.5」のAPI価格は、100万トークンあたり入力1ドル、出力5ドルと、上位モデル「Sonnet 4.5」の約3分の1のコストに設定されている。
詳細は公式ドキュメントの「Pricing」セクションに準拠している。

項目 100万トークンあたりの料金
入力トークン 1.00ドル
出力トークン 5.00ドル

プロンプトキャッシュ利用時の料金
(※一度処理したプロンプトを保存・再利用し、再計算コストを削減する仕組み)

処理内容 100万トークンあたりの料金
書き込み(Write) 1.25ドル
読み出し(Read) 0.10ドル
モバイルバージョンを終了