モデル・技術

Claude 3.5 Sonnetとは?コーディングで食い込む中間世代の標準

読み:くろーど さんてんご そねっと / 英:Claude 3.5 Sonnet

更新日: 読了目安:約7分

Claude 3.5 Sonnetは、Claude 3.5世代の標準モデルです。3 Sonnetが「世代3の顔」——マルチモーダル標準帯の確立——だったのに対し、3.5 Sonnetは世代番号は半歩進んだ中間更新ながら、コーディング性能を刃にしてGPT-4o世代と競合するモデルでした。本記事はベンチマーク表の暗記ではなく、「なぜ汎用Sonnetが開発者のデフォルトになったか」に焦点を当てます。

試験で問われる見方

開発元はAnthropic(TF-0142)。3.5 SonnetはClaude系列の標準帯であり、OpenAIのGPT-4oTF-0147)と開発元が異なる別製品です。単純な対応表にしないことが重要です。

コーディング文脈では、コード支援モデルの系譜——TF-0150(Codex等)——と並べ、3.5 Sonnetを汎用LLMのコーディング強化版として整理します。Codexそのものではありません。

生成コードはレビュー必須——説明が丁寧でも実装が正しいとは限りません(TF-0460)。

3.5 Sonnetとは

2024年6月頃、AnthropicはClaude 3.5 Sonnetを公開しました。Claude 3の Opus / Sonnet / Haiku から半年ほどで中間世代が差し込まれ、Sonnet名称はそのままに能力が底上げされる——というリリース戦略が特徴です。

公開時にはソフトウェアエンジニアリングベンチマークや実務のコーディングタスクで高評価が報じられ、claude.ai のデフォルトも3.5 Sonnetへ移行しました。「開発者が最初に選ぶClaude」としての地位を固めたモデルと整理できます。

3と4の間のドット世代

種類試験での整理
整数世代Claude 3 → Claude 4大きな世代更新
ドット世代Claude 3 → 3.5同系統の中間強化。3.5 Sonnetはここ
階層名Sonnet / Haiku / Opus世代をまたぐ標準・軽量・最上位ラベル

「3.5 Sonnet=3 Sonnet」と同一視しないこと、また「3.5=4」でもないこと——番号の粒度を試験で区別します。

コーディングという楔(くさび)

3 Sonnetがマルチモーダル一般業務の標準だったのに対し、3.5 Sonnetの差別化はコードに集中しました。

  • 実装・リファクタリング 複数ファイルにまたがる変更の提案
  • デバッグ エラーログとソースの突合、修正パッチの生成
  • テスト生成 境界条件を意識したユニットテスト案
  • コードレビュー補助 セキュリティ・可読性の指摘草案

これはo4 miniGemini 2.5 Proなど、他社の「コーディング強化」と同じ戦場での競争です。試験では開発元の区別が核心で、ベンチマーク順位の暗記は不要です。

GPT-4oとの競合軸

観点Claude 3.5 SonnetGPT-4o
開発元AnthropicOpenAI
系列Claude Sonnet帯GPT-4オムニ系列
当時の訴求コーディング・分析の底上げオムニ統合・音声対話
試験TF-0142TF-0147

どちらも「2024年の実務主力」として比較されますが、同一モデル・同一開発元ではない——比較問題の入れ替えに注意します。

生成コードのレビュー規律

コーディング性能が上がっても、試験・実務で変わらない原則があります。

  1. 生成 — 3.5 Sonnetが草案・パッチを出力
  2. レビュー — 人間またはCIが論理・セキュリティを確認
  3. テスト — 自動テストで回帰を検知
  4. 限界 — もっともらしいコードでもバグは残りうる(TF-0460)

TF-0150が示すコード支援の歴史(Codex → Copilot等)と同様、支援ツール=品質保証の代替ではないという整理が試験の核心です。

すり替えに注意

誤った説明正しい理解
3.5 Sonnet=3 Sonnet中間世代の別モデル
3.5 Sonnet=Codex汎用Sonnet vs コード特化系列(TF-0150)
3.5 Sonnet=GPT-4oAnthropic vs OpenAI
コーディング最強=本番直デプロイ可レビュー・テスト必須
3.5 Sonnet=Claude 4 Sonnet世代が異なる(後続)

よくある質問

3.5 Sonnetと3 Sonnetの違いは?

名称のSonnetは共通ですが、3.5は中間世代アップデートでコーディング・推論・速度が強化された別モデルです。試験では世代番号(3 / 3.5 / 4)を混同しないことが重要です。

3.5 Sonnetはコーディング専用モデルですか?

専用モデルではなく、汎用の標準帯です。ただしコーディング性能の強化が最大の訴求点の一つであり、実務では開発支援のデフォルトとして選ばれることが多くなりました。

生成コードはそのまま本番に使えますか?

いいえ。コーディング性能が高くても、生成コードのレビューとテストは必要です。もっともらしい説明と正確な実装は別問題として整理します。