MENU

Claudeがさらにアップデート!『Computer use』&『Claude 3.5 Haiku』の新機能を探る

こんにちは!AI-Bridge Labのせいやです!

2024年10月22日にAnthropicが衝撃的なアップデートを発表しましたね!
その目玉は、ユーザーの指示に従って自動的にPCを操作してくれるという驚異的な機能を備えた「Computer use」。これによって、これまで煩雑だったPC作業を、まるで魔法のように人間に変わって自動でやってくれるという夢のような話が現実になりつつあります。
さらに、今回のアップデートでは、Claude 3.5シリーズの軽量モデル「Claude 3.5 Haiku」も登場。
この記事では、アップグレードした「Claude 3.5 Haiku」と「Claude 3.5 Sonnet」、および新機能について詳しくご紹介していきます!

目次

Claude 3.5 Haikuの登場

Claude 3.5 Haikuは、速度とコスト面では前世代のHaikuと同等ですが、性能面では3.0 Opusモデルに匹敵します。
特に、プログラミングタスクを評価する「HumanEval」では88.1%のスコアを記録し、数学的な推論を評価する「MATH」では69.2%を達成しています。
つまり何が変わったのかというとAIが人間に近いレベルで高度なコーディング作業に対応できるようになり、開発者やプログラマーにとって以前によりもさらに有用なツールになったということです。(あくまでベンチマーク数値上は)

今回のバージョンアップでプログラミングの効率が向上し、開発スピードが飛躍的に上がることが期待されています。
今後は、AIがプロジェクト全体の管理や設計フェーズにも関与する可能性があり、さらなる技術革新が期待できます。
そんなClaude 3.5 Haikuは、今月末にリリースされる予定です。

Claude 3.5 Sonnetの進化

最新バージョン「Claude 3.5 Sonnet」の性能指標

そしてClaude 3.5 Sonnetに関しては、特にコーディング分野で大きく進化しました。このアップデートによって、大学院レベルの専門知識を問うデータセット「GPQA」ではスコアが59.4%から65.0%に向上し、さらにソフトウェア開発における実際の課題解決を評価する「SWE-bench」のスコアも33.4%から49.0%に大幅に改善されています。
例えるなら、以前はプログラミングの基礎を理解している大学生レベルだったのが、今では大学院で専門的に学んだレベルにまで成長したようなものです。
なので、Sonnet自体も複雑で高度なコーディングの依頼にも対応できるようになるかもしれません。

AIによるコーディング支援が可能な「Bolt」や「Cursor」など、Claude 3.5 SonnetのAPIを利用しているサービスの強化も期待できますね。

https://note.com/doerstokyo_kb/n/n28eebc00a821

PC操作を自動で行ってくれる「神機能」の発表

そんな中でもみなさんが今回一番気になったのは、新たに導入された「Computer use」ではないでしょうか?
Claudeがユーザーの指示を認識して、自動でスクリーンショットを解析したり、カーソルを動かしてボタンをクリックしたり、テキストを入力することが可能になりました。これにより、単純作業やルーティンワークをAIに任せることで、作業の手間を大幅に削減することができます。
また、複数のアプリケーションを跨いだ操作もスムーズに行えるため、今まで複雑だったタスクも自動化が進んで作業効率が大幅に上がるでしょう。

「Computer use」機能の詳細

ここからはAnthropicが公開しているデモ動画を見ながらその機能を確認していきます。
まずは単純な作業から見てみましょう。

https://youtu.be/jqx18KgIzAE

引用元

Claudeを使った友人とのハイキング計画の流れ

Claudeに対して「友人がサンフランシスコに来るので、明日の朝、ゴールデンゲートブリッジで一緒に日の出を見たいと思っています。私たちはパシフィックハイツから出発するので、おすすめの観賞スポットと、そこまでの所要時間、日の出の時刻を調べて、時間に余裕を持って到着できるカレンダーイベントを設定してくれませんか?」と一気に指示を出す。

すると…

  • ClaudeがChromeブラウザを開き、Googleでサンライズハイキングに適した場所を検索する。

  • Googleマップを開き、現在地からハイキング場所までの距離を調べる。

  • 明日の日の出時刻を調べ、カレンダーに予定を追加する。

  • 予定の詳細を入力する。

と一連の流れを複数のサイトにアクセスしながら自動で行っていました。
これはかなり便利ですね!日常の中で応用できるので別の作業を進めながら、同時に複数のタスクを片付けてくれそうです。

予想される日常生活でのユースケース

パーソナライズされた読書リストの作成
ユーザーの読書履歴や評価した本のデータをもとに、個々の好みに合った本を提案してくれて、自然言語処理技術を活用しながら、本のレビューやあらすじを解析して、興味のあるジャンルや作家の新作を見つけ出すことが可能になるかもしれませんね!

また、オンライン書店や図書館の在庫状況もリアルタイムでチェックしてくれるようになり、購入や貸し出しの選択肢を与えてくれたら読書がもっと楽しくなりそうです。

続いては、少し難易度が上がりますが、「ホームページ作成」の依頼をしています。

https://youtu.be/vH2f7cjXjKI

引用元

90年代風ウェブサイト作成の流れ

この動画では、Claude.aiを使って90年代風の個人ウェブサイトを作成する様子が紹介されています。

  1. Claude.aiへの指示:

    • ブラウザでClaudeを開き、チャット形式で「90年代スタイルのテーマで個人ウェブサイトを作成する」ように指示を出します。

  2. コードの自動生成:

    • Claudeが指示を理解して、別のClaudeに指示を出して、90年代風のウェブサイトのHTMLコードを自動的に生成します!生成されたコードは、画面右側の「Artifact」に表示されます。

  3. コードのダウンロードと編集:

    • 「ClaudeにファイルをダウンロードしてVS Codeで開くように」と指示すると、Claude.aiが生成したHTMLコードをファイルに保存し、コードエディタの「VS Code」で開いてくれます。VS Codeとは、コードを分かりやすく表示・編集するためのツールです。

  4. ローカルサーバーの起動:

    • 「ターミナルを開いて、現在のHTMLファイルを実行するためのサーバーを起動してください。ファイルはメニューバーから選択してください。」と指示します。

    • VS Codeのターミナルで、Pythonを使ってローカルサーバーを起動しようとしますが、Pythonがインストールされていないためエラーが発生します。

    • しかし、すぐにPython 3で再試行し、ローカルサーバーを起動します。これで、作成したウェブサイトをブラウザで実際に表示できるようになります。

  5. エラーの発生と修正:

    • ターミナル出力にエラーが表示され、ファイルのアイコンに欠陥があることに気づきます。

    • 「開いているファイルから問題のある行を削除して、ターミナルのエラーを修正してもらえますか?」と指示します。

    • Claudeは、ターミナル出力を読み取ってエラーの原因を特定し、VS Codeの検索・置換機能を使ってエラー箇所を修正します。

    • 修正したファイルを保存し、ウェブサイトを再実行します。

  6. ウェブサイトの確認:

    • ブラウザでウェブサイトを確認し、エラーが解消され、90年代風のレトロなウェブサイトが完成していることを確認します。

予想される仕事でのユースケース

会計処理と経費管理の効率化
スプレッドシートや会計ソフトに統合された自動化ツールやAPIを活用して、経費データを迅速かつ正確に処理してくれたり、領収書や請求書のスキャンデータを読み取って、適切なカテゴリに分類し、対応する項目に入力することが可能になるかもしれません。
そうなると、定期的な集計作業や経費レポートの生成も自動化されるので、担当者は分析や戦略的な業務に集中できてミスの防止にも繋がりそうですね!個人情報などを取り扱うことになるので、セキュリティ面をカバーできるプランや、仕組みにしておく必要はあります。

使用上の注意点

「Computer use」の機能は、まだ開発中のベータ版で、使用上のリスクが未知数です。なのでネット経由でこの機能を使って操作する際は、通常版とは違い、十分な注意が必要です。安全に利用するために、以下のポイントを意識しながら使用するといいかもしれません。

  • 大切な情報は守る: 重要な情報や個人情報は、コンピューター使用機能からアクセスできないようにしましょう。

  • 安全なサイトだけを見る: 信頼できるウェブサイトだけを許可するように設定し、危険なサイトへのアクセスを防ぎましょう。

  • 大事なことは自分で決める: クッキーの許可やお金のやり取りなど、重要な決定は、AI任せにせず、必ずご自身で確認しましょう。

  • 指示は明確に: AIが誤解しないように、指示はシンプルかつ明確に伝えることが重要です。

  • 従量課金制:「Claude 3.5 Sonnet」 は「Haiku」はAPI経由で利用するモデルなので使用したトークン数によって料金がかかってくることを把握しましょう。https://www.anthropic.com/pricing#anthropic-api(API料金)

まとめ

AnthropicのClaude3.5 SonnetとHaikuのアップデートは、AIの可能性を大きく広げる画期的なものでした。
「Claude 3.5 Haiku」と「Claude 3.5 Sonnet」の性能向上、そしてのコーディング能力の大幅な向上は、開発者やプログラマーにとって強力な武器になりそうです!
さらに、私たちの働き方や生活スタイルを根本的に変える可能性を秘めている「Computer use」は、これまで人間が行ってきた手間のかかるタスクをAIに任せ、より創造的な活動に集中できるという未来を見せてくれました。
実際「Computer use」はまだベータ版であり、セキュリティ面など課題も残されていますが、Asana、Canva、Replitといった企業がClaude 3.5 Sonnetの導入実験に着手している点は、その可能性の高さを示す一例と言えるでしょう。
Anthropicの動向にはこれからも目が離せませんね!

AI-Bridge Labについて

AI-Bridge Labは、最新のAI技術とその活用方法について情報を発信し、企業のDX実現をサポートしています。AIを活用したソリューションや人材育成にご興味があれば、お気軽にご連絡ください!

メール:ai_business@doerstokyo.jp

最後まで読んでいただき、ありがとうございました。
気に入って頂けましたら「スキ」や「フォロー」「コメント」をしていただけると幸いです😄

この記事が気に入ったら
フォローしてね!

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

DoersTokyo株式会社(https://doerstokyo.jp/)でAIの活用事例や最新情報の調査と検証を行っています
「AI-Bridge Lab(エーアイブリッジラボ)」と申します。

【メインコンテンツ】
大規模言語モデル(LLM)や画像、音楽、動画生成などのコンテンツ制作系のAI情報

コメント

コメントする

目次