MENU

Claude 4がリリース‼︎「Opus」「Sonnet」の実力とは?

こんにちは!AI-Bridge Labのせいやです😊

Anthropicの最新AI「Claude 4」がリリースしました!
アップデートのたびに驚きをもたらしてきたClaudeシリーズですが、今回も例外ではありません。

中でも注目したいのは、会話の流れを見事に捉える理解力と、複雑な推論をスムーズにこなす知性が格段に進化している点です。これにより、長文でのやりとりや、抽象的・複雑な話題にも一層深く対応できるようになりました。

本記事では、Claudeの「Opus 4」と「Sonnet 4」という2つのモデルにスポットを当て、それぞれの性能、ベンチマーク結果、価格情報、そして実際の活用例までを詳しく掘り下げていきます。

目次

Claude 4とは

Anthropicが開発した最新の大規模言語モデル「Claude 4」は、Opus 4とSonnet 4という2種類のモデルで構成されています。

Opus 4は、SWE-benchやTerminal-benchなどで業界トップの性能を記録しており、高度な推論や長期的なタスクへの対応能力に優れています。

一方、Sonnet 4は、Sonnet 3.7の後継として登場し、指示の理解や推論精度が大きく向上しています。

両モデルに共通するのは、「拡張された思考(Extended Thinking)」と呼ばれる先進的な機能です。
推論とツール利用を繰り返すことで、AIがより実用的なエージェントとして機能する能力が飛躍的に高まっています。

Claude 4の注目機能

1.高性能メモリ機能

  • 開発者がローカルファイルへのアクセスを許可した場合、メモリ機能が大幅に向上
  •  Claude 4は重要な事実を抽出・保存することに優れていて、Opus 4は「メモリファイル」を作成し維持することに優れています。
  • 高度なプロンプトエンジニアリングなどで生の思考連鎖が必要なユーザー向けに、「Developer Mode」も用意されています(要問い合わせ)。

2.ツールを利用した 拡張思考(Extended thinking)

  • Opus 4 と Sonnet 4 の両モデルで利用可能。
  • 複数のツールを並列して使用できる(ベータ版)。推論とツール利用(ウェブ検索など)を組み合わせて応答を改善しました。

3.ショートカットするAIの行動を削減

  • タスク完了のために安易な近道や抜け穴を使おうとするモデルの振る舞いを大幅に削減してくれます
  • 特にエージェントタスクにおいて、 Sonnet 3.7と比較して65%削減されました。 

4.Claude Codeが一般提供開始

  • 開発ワークフロー(ターミナル、IDE、バックグラウンド)へのClaudeの能力を拡張。
  • GitHub Actions 経由でのバックグラウンドタスク実行に対応しました。
  • VS Code および JetBrains とのネイティブ統合に対応。IDE内でファイルに直接編集提案を表示し、シームレスな開発体験を提供します。

使い方

赤枠をクリックするとモデルを選べます。

「営業✖️AI活用」のセミナーで使用していたドキュメントを投げて、スライド資料を作ってもらいました。

前モデルであるClaude 3.7 Sonnetでは、スライドの端がフレームからはみ出してしまうことがありました。
しかし、今回のモデルではその問題が完全に解消され、スライド全体が美しくフレーム内に収まるようになりました。
仕上がりも見事で、視認性が大幅に向上しています。

業界最高水準のベンチマーク性能

Terminal-bench(ターミナル操作の自動化の性能テスト)

・GPQA Diamond(大学院レベル推論)
 正答率:79.6% → 83.3%(拡張思考使用時)
・AIME(高校数学コンテスト)
 正答率:75.5% → 90.0%(拡張思考使用時)
・MMLU(多言語Q&A)
 正答率:88.8%
推論・数学・言語理解において極めて高水準

Opus 4は自動コード修正で43.2%の高スコアを記録し、GPT-4やGemini Proを上回る性能を発揮しています!

SWE-bench(実際のソフトウェアエンジニアのタスクにおける性能評価)

  • Opus 4:72.5%(通常)、最大79.4%(高計算条件)
  • Sonnet 4:72.7%、最大80.2%

実際の活用事例

スライド生成

プロンプトを工夫するだけでかなり精度の高いおしゃれなスライド資料を作ってくれることがわかります。

https://twitter.com/Park_AI362489/status/1925611344004526248

アプリ制作

ビジュアルと操作性が進化して、ユーザーの希望通りのWEBアプリを作ってくれそうです。

https://twitter.com/AIHR_fujimomo/status/1925755102859599905

ゲーム制作

コードの精度が向上して、制作時間もグッと短縮。
結果として、ゲーム開発のクオリティが飛躍的に高まっているという声が上がっています。

https://twitter.com/kokisennyu/status/1925627055745417416

料金体系

通常料金

API利用料金

モデル料金
API経由でClaudeの各モデル(Opus 4やSonnet 4)を使用する際には、入出力トークンごとに基本料金が発生します。

それぞれのモデルで異なるレートが設定されており、利用目的に応じたコスト管理が求められます。

バッチ料金(50%オフ)
一度に大量のリクエストを非同期で処理できるAPI機能により、運用効率が大幅に向上します。
通常よりも割安なトークン料金が適用されるため、コスト効率の面でも非常に優れた選択肢となっています。

まとめ

今、AIの進化を最前線で体感できる──それが最新のClaude 4です。
思考力、記憶力、そして開発環境との統合性に至るまで、すべてが大きく向上しています。

長期記憶を備えたことで、複雑な会話や多層的なタスクにも安定して対応可能。さらに、“ショートカット的な処理”の抑制により、より正確で緻密な応答が実現しています。

この進化をまだ体験していない方は、ぜひ一度試して、その違いを実感してみてください。

AI-Bridge Labについて

AI-Bridge Labでは、今後も生成AIの活用事例について、継続的に情報を発信していきます。最新のAI技術とその活用方法について、ぜひ一緒に学んでいきましょう!

メール:ai_business@doerstokyo.jp

この記事が気に入ったら
フォローしてね!

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

DoersTokyo株式会社(https://doerstokyo.jp/)でAIの活用事例や最新情報の調査と検証を行っています
「AI-Bridge Lab(エーアイブリッジラボ)」と申します。

【メインコンテンツ】
大規模言語モデル(LLM)や画像、音楽、動画生成などのコンテンツ制作系のAI情報

コメント

コメントする

目次