Claude 3.5 Sonnetは、Claude 3.5世代の標準モデルです。3 Sonnetが「世代3の顔」——マルチモーダル標準帯の確立——だったのに対し、3.5 Sonnetは世代番号は半歩進んだ中間更新ながら、コーディング性能を刃にしてGPT-4o世代と競合するモデルでした。本記事はベンチマーク表の暗記ではなく、「なぜ汎用Sonnetが開発者のデフォルトになったか」に焦点を当てます。
試験で問われる見方
開発元はAnthropic(TF-0142)。3.5 SonnetはClaude系列の標準帯であり、OpenAIのGPT-4o(TF-0147)と開発元が異なる別製品です。単純な対応表にしないことが重要です。
コーディング文脈では、コード支援モデルの系譜——TF-0150(Codex等)——と並べ、3.5 Sonnetを汎用LLMのコーディング強化版として整理します。Codexそのものではありません。
生成コードはレビュー必須——説明が丁寧でも実装が正しいとは限りません(TF-0460)。
3.5 Sonnetとは
2024年6月頃、AnthropicはClaude 3.5 Sonnetを公開しました。Claude 3の Opus / Sonnet / Haiku から半年ほどで中間世代が差し込まれ、Sonnet名称はそのままに能力が底上げされる——というリリース戦略が特徴です。
公開時にはソフトウェアエンジニアリングベンチマークや実務のコーディングタスクで高評価が報じられ、claude.ai のデフォルトも3.5 Sonnetへ移行しました。「開発者が最初に選ぶClaude」としての地位を固めたモデルと整理できます。
3と4の間のドット世代
| 種類 | 例 | 試験での整理 |
|---|---|---|
| 整数世代 | Claude 3 → Claude 4 | 大きな世代更新 |
| ドット世代 | Claude 3 → 3.5 | 同系統の中間強化。3.5 Sonnetはここ |
| 階層名 | Sonnet / Haiku / Opus | 世代をまたぐ標準・軽量・最上位ラベル |
「3.5 Sonnet=3 Sonnet」と同一視しないこと、また「3.5=4」でもないこと——番号の粒度を試験で区別します。
コーディングという楔(くさび)
3 Sonnetがマルチモーダル一般業務の標準だったのに対し、3.5 Sonnetの差別化はコードに集中しました。
- 実装・リファクタリング 複数ファイルにまたがる変更の提案
- デバッグ エラーログとソースの突合、修正パッチの生成
- テスト生成 境界条件を意識したユニットテスト案
- コードレビュー補助 セキュリティ・可読性の指摘草案
これはo4 miniやGemini 2.5 Proなど、他社の「コーディング強化」と同じ戦場での競争です。試験では開発元の区別が核心で、ベンチマーク順位の暗記は不要です。
GPT-4oとの競合軸
| 観点 | Claude 3.5 Sonnet | GPT-4o |
|---|---|---|
| 開発元 | Anthropic | OpenAI |
| 系列 | Claude Sonnet帯 | GPT-4オムニ系列 |
| 当時の訴求 | コーディング・分析の底上げ | オムニ統合・音声対話 |
| 試験 | TF-0142 | TF-0147 |
どちらも「2024年の実務主力」として比較されますが、同一モデル・同一開発元ではない——比較問題の入れ替えに注意します。
生成コードのレビュー規律
コーディング性能が上がっても、試験・実務で変わらない原則があります。
- 生成 — 3.5 Sonnetが草案・パッチを出力
- レビュー — 人間またはCIが論理・セキュリティを確認
- テスト — 自動テストで回帰を検知
- 限界 — もっともらしいコードでもバグは残りうる(TF-0460)
TF-0150が示すコード支援の歴史(Codex → Copilot等)と同様、支援ツール=品質保証の代替ではないという整理が試験の核心です。
すり替えに注意
| 誤った説明 | 正しい理解 |
|---|---|
| 3.5 Sonnet=3 Sonnet | 中間世代の別モデル |
| 3.5 Sonnet=Codex | 汎用Sonnet vs コード特化系列(TF-0150) |
| 3.5 Sonnet=GPT-4o | Anthropic vs OpenAI |
| コーディング最強=本番直デプロイ可 | レビュー・テスト必須 |
| 3.5 Sonnet=Claude 4 Sonnet | 世代が異なる(後続) |
よくある質問
3.5 Sonnetと3 Sonnetの違いは?
名称のSonnetは共通ですが、3.5は中間世代アップデートでコーディング・推論・速度が強化された別モデルです。試験では世代番号(3 / 3.5 / 4)を混同しないことが重要です。
3.5 Sonnetはコーディング専用モデルですか?
専用モデルではなく、汎用の標準帯です。ただしコーディング性能の強化が最大の訴求点の一つであり、実務では開発支援のデフォルトとして選ばれることが多くなりました。
生成コードはそのまま本番に使えますか?
いいえ。コーディング性能が高くても、生成コードのレビューとテストは必要です。もっともらしい説明と正確な実装は別問題として整理します。