Kategorien
Nachrichten

 Die Einführung von Claude 3.5 Sonnet: Setzen neuer Maßstäbe in der KI mit verbessertem Intelligenz und Geschwindigkeit

Claude 3.5 Sonnet, die neueste Version der Claude 3.5-Modellfamilie, bringt bedeutende Fortschritte in den KI-Fähigkeiten. Es zeichnet sich durch Intelligenz-Benchmarks aus, arbeitet doppelt so schnell wie frühere Modelle und bietet kostengünstige Preise. Neue Funktionen wie Artefakte verbessern die Benutzerinteraktion, indem sie Echtzeit-Kollaborationstools bereitstellen. Sicherheitsmaßnahmen umfassen strenge Tests und die Einbindung externer Experten, um die Einhaltung der ASL-2-Standards sicherzustellen und den Benutzerschutz zu priorisieren. Zukünftige Updates umfassen die Veröffentlichung von Claude 3.5 Haiku und Claude 3.5 Opus sowie laufende Verbesserungen zur Unterstützung verschiedener Geschäftsanwendungen und zur Integration von Benutzerfeedback.

Heute starten wir Claude 3.5 Sonnet – unsere erste Veröffentlichung in der bevorstehenden Claude 3.5-Modellfamilie. Claude 3.5 Sonnet setzt den Branchenstandard für Intelligenz höher, übertrifft Konkurrenzmodelle und Claude 3 Opus in einer Vielzahl von Bewertungen mit der Geschwindigkeit und den Kosten unseres mittleren Modells, Claude 3 Sonnet.

Claude 3.5 Sonnet ist jetzt kostenlos auf Claude.ai und der Claude iOS-App verfügbar, während Abonnenten von Claude Pro und Teamplan auf deutlich höhere Ratenbeschränkungen zugreifen können. Es ist auch über die Anthropic-API, Amazon Bedrock und Google Cloud’s Vertex AI verfügbar. Das Modell kostet 3 $ pro Million Eingabetoken und 15 $ pro Million Ausgabetoken, mit einem Kontextfenster von 200.000 Token.

Frontier-Intelligenz mit doppelter Geschwindigkeit

Claude 3.5 Sonnet setzt neue Branchenstandards für Abschlussprüfungen auf Hochschulniveau (GPQA), Wissen auf Bachelor-Niveau (MMLU) und Codierfähigkeiten (HumanEval). Er zeigt eine deutliche Verbesserung beim Erfassen von Feinheiten, Humor und komplexen Anweisungen und ist außergewöhnlich gut darin, qualitativ hochwertige Inhalte mit einem natürlichen, ansprechenden Ton zu schreiben.

Claude 3.5 Sonnet arbeitet doppelt so schnell wie Claude 3 Opus. Dieser Leistungsschub in Verbindung mit kostengünstigen Preisen macht Claude 3.5 Sonnet ideal für komplexe Aufgaben wie kontextsensitive Kundenbetreuung und die Orchestrierung von mehrstufigen Workflows.

In einer internen agentischen Codierungsbewertung löste Claude 3.5 Sonnet 64% der Probleme und übertraf damit Claude 3 Opus, das 38% löste. Unsere Bewertung testet die Fähigkeit des Modells, einen Fehler zu beheben oder eine Funktionalität zu einer Open-Source-Codebasis hinzuzufügen, basierend auf einer natürlichen Sprachbeschreibung der gewünschten Verbesserung. Wenn angewiesen und mit den entsprechenden Werkzeugen versehen, kann Claude 3.5 Sonnet eigenständig Code mit ausgefeilter Argumentation und Fehlerbehebung schreiben, bearbeiten und ausführen. Es handhabt Codeübersetzungen mühelos, was es besonders effektiv für die Aktualisierung von Legacy-Anwendungen und die Migration von Codebasen macht.

State-of-the-art-Vision

Claude 3.5 Sonnet ist unser stärkstes Vision-Modell bisher und übertrifft Claude 3 Opus in standardmäßigen Vision-Benchmarks. Diese revolutionären Verbesserungen sind besonders für Aufgaben bemerkenswert, die visuelles Denken erfordern, wie die Interpretation von Diagrammen und Grafiken. Claude 3.5 Sonnet kann auch Text genau aus unvollkommenen Bildern transkribieren – eine Kernfähigkeit für Einzelhandel, Logistik und Finanzdienstleistungen, wo KI aus einem Bild, einer Grafik oder einer Illustration mehr Erkenntnisse gewinnen kann als allein aus Text.

Artefakte – eine neue Art, Claude zu nutzen

Heute stellen wir auch Artefakte auf Claude.ai vor, eine neue Funktion, die erweitert, wie Benutzer mit Claude interagieren können. Wenn ein Benutzer Claude bittet, Inhalte wie Code-Snippets, Textdokumente oder Website-Designs zu generieren, erscheinen diese Artefakte in einem dedizierten Fenster neben ihrem Gespräch. Dies schafft einen dynamischen Arbeitsbereich, in dem sie Claude’s Kreationen in Echtzeit sehen, bearbeiten und darauf aufbauen können, indem sie KI-generierte Inhalte nahtlos in ihre Projekte und Workflows integrieren.

Diese Vorschau kennzeichnet Claudes Entwicklung von einer AI, die Konversationen führen kann, zu einer kollaborativen Arbeitsumgebung. Es ist erst der Anfang einer umfassenderen Vision für Claude.ai, die bald erweitert wird, um die Teamzusammenarbeit zu unterstützen. In naher Zukunft werden Teams – und schließlich ganze Organisationen – in der Lage sein, ihr Wissen, ihre Dokumente und laufenden Arbeiten sicher in einem gemeinsamen Raum zu zentralisieren, wobei Claude als Teamkollege auf Abruf fungiert.

Verpflichtung zur Sicherheit und Privatsphäre

Unsere Modelle unterliegen rigorosen Tests und wurden darauf trainiert, Missbrauch zu reduzieren. Trotz des Intelligenzsprungs von Claude 3.5 Sonnet haben unsere Red-Teaming-Bewertungen ergeben, dass Claude 3.5 Sonnet weiterhin auf ASL-2 ist. Weitere Details finden Sie im Modellkarten-Nachtrag.

Als Teil unseres Engagements für Sicherheit und Transparenz haben wir externe Experten damit beauftragt, die Sicherheitsmechanismen innerhalb dieses neuesten Modells zu testen und zu verbessern. Kürzlich haben wir Claude 3.5 Sonnet dem Artificial Intelligence Safety Institute des Vereinigten Königreichs (UK AISI) zur Sicherheitsbewertung vor der Bereitstellung zur Verfügung gestellt. Das UK AISI hat Tests mit 3.5 Sonnet durchgeführt und die Ergebnisse mit dem US Artificial Intelligence Safety Institute (US AISI) im Rahmen einer Vereinbarung über Memorandum of Understanding geteilt, die durch die Partnerschaft zwischen den US- und UK-AISIs früher in diesem Jahr angekündigt wurde.

Wir haben Richtlinienfeedback von externen Fachleuten erhalten, um sicherzustellen, dass unsere Bewertungen robust sind und neue Trends im Missbrauch berücksichtigen. Dieses Engagement hat unseren Teams geholfen, unsere Fähigkeit zur Bewertung von 3.5 Sonnet gegen verschiedene Arten von Missbrauch auszubauen. Beispielsweise haben wir Rückmeldungen von Kindersicherheitsexperten bei Thorn verwendet, um unsere Klassifizierer zu aktualisieren und unsere Modelle zu feinabzustimmen.

Eines der grundlegenden verfassungsrechtlichen Prinzipien, die unsere KI-Modellentwicklung leiten, ist die Privatsphäre. Wir trainieren unsere generativen Modelle nicht mit von Benutzern eingereichten Daten, es sei denn, ein Benutzer gibt uns ausdrücklich die Erlaubnis dazu. Bislang haben wir keine Kunden- oder benutzerbezogenen Daten verwendet, um unsere generativen Modelle zu trainieren.

Demnächst verfügbar

Unser Ziel ist es, alle paar Monate den Trade-off zwischen Intelligenz, Geschwindigkeit und Kosten erheblich zu verbessern. Um die Claude 3.5 Modellfamilie abzuschließen, werden wir später in diesem Jahr Claude 3.5 Haiku und Claude 3.5 Opus veröffentlichen.

Neben der Arbeit an unserer Modellfamilie der nächsten Generation entwickeln wir neue Modalitäten und Funktionen, um mehr Anwendungsfälle für Unternehmen zu unterstützen, einschließlich Integrationen mit Unternehmensanwendungen. Unser Team erkundet auch Funktionen wie Memory, mit denen Claude die Vorlieben und Interaktionshistorie eines Benutzers gemäß den Vorgaben speichern und so ihr Erlebnis noch persönlicher und effizienter gestalten kann.

Wir arbeiten ständig daran, Claude zu verbessern, und freuen uns über das Feedback unserer Benutzer. Sie können Feedback zu Claude 3.5 Sonnet direkt im Produkt abgeben, um unseren Entwicklungsplan zu informieren und unseren Teams zu helfen, Ihr Erlebnis zu verbessern. Wir sind gespannt darauf, zu sehen, was Sie mit Claude aufbauen, kreieren und entdecken.

Der Inhalt dieses Artikels wurde aus dem Originalartikel übersetzt

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert