カテゴリー
ニュース

クロード 3.5 ソネット:AI の性能とスピードを向上させる新基準

クロード 3.5 ソネットは、クロード 3.5 モデルファミリーの最新リリースで、AI の機能における重要な進歩をもたらしています。知能のベンチマークで優れ、以前のモデルよりも2倍の速さで動作し、コスト効率の良い価格設定を提供しています。アーティファクトなどの新機能により、リアルタイムのコラボレーションツールを提供することでユーザーとのやり取りを向上させています。安全対策には厳密なテストと外部専門家との協力が含まれ、ASL-2 標準の遵守とユーザーのプライバシーを重視しています。今後のアップデートには、クロード 3.5 ハイクとクロード 3.5 オーパスのリリースが含まれ、多様なビジネスアプリケーションとユーザーフィードバックの統合をサポートするための継続的な改善が行われます。

今日、私たちはクロード 3.5 ソネットを発表しました – これは今後のクロード 3.5 モデルファミリーの最初のリリースです。クロード 3.5 ソネットは、知能において業界の基準を引き上げ、競合他社のモデルやクロード 3 オーパスよりも高い評価を受け、中堅モデルであるクロード 3 ソネットの速度とコストを備えています。

クロード 3.5 ソネットは、Claude.ai およびクロード iOS アプリで無料で利用できます。一方、Claude Pro および Team プランの加入者は、大幅に高いレート制限でアクセスできます。また、Anthropic API、Amazon Bedrock、Google Cloud の Vertex AI を介しても利用可能です。このモデルの価格は、入力トークン1百万あたり3ドル、出力トークン1百万あたり15ドルで、コンテキストウィンドウは20万トークンです。

2倍のスピードでの先端知能

クロード 3.5 ソネットは、大学院レベルの推論(GPQA)、学部レベルの知識(MMLU)、およびコーディング能力(HumanEval)において新しい業界基準を設定しています。微妙なニュアンス、ユーモア、複雑な指示の理解において著しい改善を示し、自然で共感的なトーンで高品質のコンテンツを書くことに優れています。

クロード 3.5 ソネットは、クロード 3 オーパスの2倍の速さで動作します。この性能向上とコスト効率の良さが組み合わさり、コンテキストに敏感な顧客サポートや複数段階のワークフローの管理などの複雑なタスクに最適です。

内部エージェントコーディング評価によると、クロード 3.5 ソネットは問題の64%を解決し、クロード 3 オーパスの38%を上回っています。私たちの評価では、自然言語の説明に基づいてオープンソースコードベースにバグを修正したり機能を追加したりするモデルの能力をテストしています。指示された内容と関連ツールが提供された場合、クロード 3.5 ソネットは洗練された推論力とトラブルシューティング能力を備えて、独立してコードを作成、編集、実行することができます。コードの翻訳を容易に処理し、レガシーアプリケーションの更新やコードベースの移行に特に効果的です。

最先端のビジョン技術

クロード 3.5 ソネットは、標準的なビジョンベンチマークにおいてクロード 3 オーパスを凌駕する、最強のビジョンモデルです。これらの段階的な改善は、チャートやグラフの解釈など、視覚的推論を要するタスクにおいて最も顕著です。クロード 3.5 ソネットは、不完全な画像からテキストを正確に転記する能力も備えており、これは小売業や物流、金融サービスなどで、AI が画像や図表からテキスト単体よりも多くの洞察を得ることができるコア機能です。

アーティファクト – クロードを使う新しい方法

本日、私たちはクロードにおける新機能「アーティファクト」を紹介しています。この機能は、ユーザーがコードスニペット、テキストドキュメント、ウェブサイトデザインなどのコンテンツを生成するようクロードに依頼すると、これらのアーティファクトが会話と並行して専用ウィンドウに表示されます。これにより、ユーザーはダイナミックなワークスペースを作成し、クロードの作成物をリアルタイムで見て、編集して、構築することができます。AI が生成したコンテンツをプロジェクトやワークフローにシームレスに統合することが可能となります。

このプレビュー機能は、クロードの会話型AIから協力的な作業環境への進化を示しています。これは、Claude.aiのより広いビジョンの始まりであり、近い将来、チームが安全に知識、文書、および進行中の作業を共有スペースに一元化し、クロードがオンデマンドのチームメンバーとして機能するようにサポートする予定です。

安全性とプライバシーへのコミットメント

当社のモデルは厳格なテストを受け、誤用を減らすために訓練されています。クロード 3.5 ソネットの知性の飛躍にもかかわらず、当社のレッドチームの評価によれば、クロード 3.5 ソネットは依然としてASL-2にあります。詳細はモデルカード追加資料にあります。

安全性と透明性へのコミットメントの一環として、最新モデル内の安全機構をテストおよび改善するために外部専門家と連携しています。最近、UKの人工知能安全研究所(UK AISI)にクロード 3.5 ソネットを提供し、事前展開安全性評価を受けました。米国人工知能安全研究所(US AISI)との覚書に基づき、UK AISIが3.5 ソネットのテストを完了し、今年初めに発表された米国と英国AISIのパートナーシップによって結果を共有しました。

外部の専門家からのポリシーフィードバックを統合し、評価が堅牢で新しい乱用トレンドを考慮していることを確認しています。この関与により、私たちのチームは3.5 ソネットをさまざまなミス使用に対して評価する能力を向上させました。たとえば、Thornの児童安全専門家からのフィードバックを使用して、分類子を更新し、モデルを微調整しました。

当社のAIモデル開発を導く基本的な憲法原則の1つはプライバシーです。ユーザーが明示的な許可を与えない限り、生成モデルをユーザー提出データで訓練しません。今日まで、顧客やユーザー提出データを生成モデルの訓練に使用していません。

近日公開

数ヶ月ごとに知性、速度、コストのトレードオフ曲線を大幅に改善することを目指しています。クロード 3.5 モデルファミリーを完成させるために、今年後半にはクロード 3.5 ハイクとクロード 3.5 オーパスをリリースします。

次世代モデルファミリーに取り組む他、企業向けの新しいモダリティと機能を開発しており、企業アプリケーションとの統合を含むさまざまなユースケースをサポートする機能を模索しています。私たちのチームは、ユーザーの好みとインタラクション履歴を指定された通りに記憶し、その経験をより個人的で効率的にするMemoryなどの機能も検討しています。

私たちは常にクロードを改善し、ユーザーからのフィードバックを受け付けています。Claude 3.5 Sonnetに関するフィードバックを製品内で直接提出して、開発ロードマップを通知し、ユーザーエクスペリエンスを向上させるためにチームが助けることができます。いつものように、クロードを使って構築し、作成し、発見することを楽しみにしています。

この記事の内容はオリジナル記事を翻訳したものです。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です