分類
新聞

 推出 Claude 3.5 Sonnet:以增強的智能和速度設定人工智能的新標準

Claude 3.5 Sonnet,是 Claude 3.5 模型家族中的最新版本,引入了人工智慧功能方面的顯著進步。它在智能基準方面表現出色,運作速度是之前模型的兩倍,並提供具有成本效益的定價策略。新功能如 Artifacts 通過提供實時協作工具,增強了用戶互動體驗。安全措施包括嚴格的測試和與外部專家的合作,確保符合 ASL-2 標準並優先考慮用戶隱私。未來更新將包括釋出 Claude 3.5 Haiku 和 Claude 3.5 Opus,同時不斷改進以支持各種商業應用和用戶反饋整合。

今天,我們正式推出 Claude 3.5 Sonnet—我們即將推出的 Claude 3.5 模型家族中的首個版本。Claude 3.5 Sonnet將智能水準提升至新的高度,勝過競爭對手的模型和 Claude 3 Opus,在各種評估中表現優異,速度和成本與我們的中階模型 Claude 3 Sonnet 相當。

Claude 3.5 Sonnet 現在可以在 Claude.ai 和 Claude iOS 應用程式上免費使用,而 Claude Pro 和 Team 訂閱計劃用戶則可以以更高的速率限制訪問。它還可以通過 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 使用。這款模型的價格為每百萬輸入標記 3美元,每百萬輸出標記 15美元,具有200K標記上下文窗口。

2倍速度的前沿智能

Claude 3.5 Sonnet 為研究生級推理(GPQA)、本科知識(MMLU)和編碼熟練度(HumanEval)設定了新的行業標準。它在把握細微差異、幽默和複雜指令方面有顯著改進,並且在以自然、易於理解的語調編寫高質量內容方面表現出色。

Claude 3.5 Sonnet 的運作速度是 Claude 3 Opus 的兩倍。這種性能提升,加上具有成本效益的定價策略,使得 Claude 3.5 Sonnet 非常適合於像是上下文敏感的客戶支援和協調多步驟工作流程等複雜任務。

在一項內部代理編碼評估中,Claude 3.5 Sonnet 解決了 64% 的問題,勝過解決了 38% 問題的 Claude 3 Opus。我們的評估測試了該模型在給定所需改進的自然語言描述的情況下,修復錯誤或向開源代碼庫添加功能的能力。當指示並提供相關工具時,Claude 3.5 Sonnet 可以獨立撰寫、編輯和執行具有復雜推理和故障排除能力的代碼。它輕鬆處理代碼翻譯,尤其適用於更新遺留應用程式和遷移代碼庫。

尖端視覺技術

Claude 3.5 Sonnet 是我們迄今最強大的視覺模型,勝過 Claude 3 Opus 在標準視覺基準上。這些突破性改進在需要視覺推理的任務中最為明顯,例如解釋圖表和圖形。Claude 3.5 Sonnet 也能夠準確從不完美的圖像中轉錄文本—這對於零售、物流和金融服務等領域至關重要,AI 可能從圖像、圖形或插圖中獲得比單純文本更多的洞察。

Artifacts—一種使用 Claude 的新方式

今天,我們還在 Claude.ai 上推出了 Artifacts,這是一項新功能,擴展了用戶與 Claude 互動的方式。當用戶要求 Claude 生成內容,如代碼片段、文本文件或網站設計時,這些 Artifacts 會出現在他們對話旁的特定視窗中。這創造了一個動態工作空間,用戶可以在其中實時查看、編輯和構建 Claude 的創作,無縫地將 AI 生成的內容整合到他們的項目和工作流程中。

此預覽功能標誌著 Claude 從一個對話式人工智慧演進到一個協作工作環境。這只是 Claude.ai 更廣泛願景的開始,不久將擴展到支持團隊協作。在不久的將來,團隊—最終整個組織—將能夠安全地將他們的知識、文件和正在進行的工作集中在一個共享空間中,Claude 將作為一位隨時待命的隊友。

致力於安全和隱私

我們的模型經過嚴格測試,並經過培訓以減少誤用。儘管 Claude 3.5 Sonnet 在智能上有了飛躍,但我們的紅隊評估結論是,Claude 3.5 Sonnet 仍然處於 ASL-2。更多詳細信息可在 模型卡片附錄 中找到。

作為我們致力於安全和透明度的一部分,我們已經與外部專家合作,測試並完善了這款最新模型中的安全機制。我們最近向英國人工智慧安全研究所(UK AISI)提供了 Claude 3.5 Sonnet 進行預部署安全評估。 UK AISI 完成了對 3.5 Sonnet 的測試,並與美國人工智慧安全研究所(US AISI)分享了他們的結果,作為今年早些時候美國和英國 AISI 之間合作夥伴關係的一部分 宣布

我們已經整合了外部主題專家的政策反饋,以確保我們的評估是堅固的並且考慮到濫用的新趨勢。這種參與幫助我們的團隊提升了評估 3.5 Sonnet 對各種濫用的能力。例如,我們從兒童安全專家在 Thorn 提供的反饋中更新了我們的分類器並微調了我們的模型。

指導我們人工智慧模型開發的核心憲法原則之一是隱私。除非用戶明確允許我們這樣做,否則我們不會對用戶提交的數據進行生成模型的訓練。迄今為止,我們尚未使用任何客戶或用戶提交的數據來訓練我們的生成模型。

即將推出

我們的目標是每隔幾個月大幅改善智能、速度和成本之間的權衡曲線。為了完成 Claude 3.5 模型家族,我們將在今年晚些時候推出 Claude 3.5 Haiku 和 Claude 3.5 Opus。

除了致力於我們的下一代模型家族,我們還在開發新的模態和功能,以支持更多企業用例,包括與企業應用程序的集成。我們的團隊還在探索功能,如“記憶”,這將使 Claude 能夠根據用戶指定的偏好和互動歷史記住用戶的體驗更加個性化和高效。

我們一直在努力改進 Claude,並樂於聽取用戶的意見。您可以在產品中直接提交有關 Claude 3.5 Sonnet 的反饋,以便通知我們的開發路線圖,幫助我們的團隊改善您的體驗。我們期待著看到您使用 Claude 創建、創作和發現的內容。

本文內容翻譯自 原文

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *