Categories
뉴스

 새로운 수준의 인공지능을 선보이는 Claude 3.5 Sonnet 소개

Claude 3.5 Sonnet은 Claude 3.5 모델 패밀리의 최신 버전으로, AI 능력에서 상당한 진전을 이뤘습니다. 이 모델은 지능 벤치마크에서 우수한 성과를 보여주며 이전 모델보다 두 배 빠르게 작동하고 경제적인 가격을 제공합니다. Artifacts와 같은 새로운 기능들은 실시간 협업 도구를 제공하여 사용자 상호작용을 향상시킵니다. 안전 조치로는 엄격한 테스트와 외부 전문가들과의 협력을 포함하여 ASL-2 표준 준수와 사용자 프라이버시 우선순위를 보장합니다. 향후 업데이트에는 Claude 3.5 Haiku 및 Claude 3.5 Opus의 출시가 포함되어 다양한 비즈니스 응용 프로그램과 사용자 피드백 통합을 지원하기 위한 지속적인 개선이 진행될 예정입니다.

오늘부터, 우리는 앞으로 출시될 Claude 3.5 모델 패밀리의 첫 번째 릴리스인 Claude 3.5 Sonnet을 출시합니다. Claude 3.5 Sonnet은 지능 측면에서 산업 기준을 높여, 경쟁 모델 및 Claude 3 Opus보다 더 뛰어난 평가를 받았으며, Claude 3 Sonnet의 속도와 비용을 겸비하고 있습니다.

Claude 3.5 Sonnet은 Claude.ai와 Claude iOS 앱에서 무료로 이용 가능하며, Claude Pro 및 Team 요금제 구독자는 상당히 높은 속도 제한으로 액세스할 수 있습니다. 또한 Anthropic API, Amazon Bedrock 및 Google Cloud의 Vertex AI를 통해 이용할 수 있습니다. 이 모델의 비용은 입력 토큰당 3달러, 출력 토큰당 15달러이며, 200K 토큰 컨텍스트 창을 제공합니다.

초월적인 속도로 진화하는 지능

Claude 3.5 Sonnet은 대학원 수준의 추론(GPQA), 학부 수준의 지식(MMLU), 코딩 능력(HumanEval)을 위한 새로운 산업 기준을 세웠습니다. 이 모델은 미묘함, 유머, 복잡한 지시 사항을 파악하는 데서 큰 향상을 보여주며, 자연스럽고 관련성 있는 톤으로 고품질 콘텐츠를 작성하는 데 탁월합니다.

Claude 3.5 Sonnet은 Claude 3 Opus보다 두 배 빠른 속도로 작동합니다. 이 성능 향상과 경제적인 가격이 결합되어, Claude 3.5 Sonnet은 문맥에 민감한 고객 지원 및 다단계 워크플로우 조정과 같은 복잡한 작업에 이상적입니다.

내부 에이전트 코딩 평가에서, Claude 3.5 Sonnet은 문제의 64%를 해결하며, 38%를 해결한 Claude 3 Opus를 앞섰습니다. 우리의 평가는 자연어로 원하는 개선 사항에 대한 설명을 받아들이고 오픈 소스 코드베이스에 버그를 수정하거나 기능을 추가하는 모델의 능력을 테스트합니다. Claude 3.5 Sonnet은 지시된 대로 그리고 관련 도구를 제공받을 경우, 정교한 추론 및 문제 해결 능력으로 독립적으로 코드를 작성, 편집 및 실행할 수 있습니다. 이 모델은 코드 번역을 손쉽게 처리하여 레거시 응용 프로그램 업데이트 및 코드베이스 이전에 특히 효과적입니다.

최신 비전 기술

Claude 3.5 Sonnet은 표준 비전 벤치마크에서 Claude 3 Opus를 능가하는 우수한 비전 모델입니다. 이러한 엄청난 개선 사항은 차트 및 그래픽을 해석하는 등 시각적 추론이 필요한 작업에 가장 두드러지게 나타납니다. Claude 3.5 Sonnet은 또한 불완전한 이미지로부터 텍스트를 정확하게 전사하는 능력을 갖추고 있어, 이미지, 그래픽 또는 일러스트레이션에서 AI가 텍스트만큼이나 더 많은 통찰을 얻을 수 있는 소매, 물류 및 금융 서비스와 같은 분야에 핵심 능력을 제공합니다.

Artifacts – Claude 사용의 새로운 방법

오늘부터, Claude.ai에서 사용 가능한 Artifacts를 소개합니다. 이 새로운 기능은 사용자가 Claude에게 코드 스니펫, 텍스트 문서 또는 웹사이트 디자인과 같은 콘텐츠 생성을 요청할 때, 이러한 Artifacts가 대화와 함께 전용 창에 표시됩니다. 이를 통해 사용자는 실시간으로 Claude의 작품을 보고, 편집하고, 빌드할 수 있는 동적 작업 공간을 만들어 프로젝트 및 워크플로에 AI 생성 콘텐츠를 통합함으로써 창의적으로 활용할 수 있습니다.

이 미리보기 기능은 Claude의 대화형 AI에서 협업작업 환경으로의 진화를 표시합니다. Claude.ai에 대한 보다 광범위한 비전의 시작에 불과하며 곧 팀 협업을 지원하기 위해 확대될 예정입니다. 가까운 미래에 팀 및 최종적으로 전체 기관이 Claude를 온디맨드 팀원으로 활용하여 지식, 문서 및 진행 중인 작업을 안전하게 중앙 집중화 할 수 있게 될 것입니다.

안전 및 개인 정보 보호에 대한 약속

우리의 모델은 엄격한 테스트를 거쳤으며 남용을 줄이기 위해 훈련되었습니다. Claude 3.5 Sonnet의 지능적인 진화에도 불구하고, 우리의 레드팀 평가에서 Claude 3.5 Sonnet은 여전히 ASL-2에 머무른다는 결론을 내렸습니다. 더 많은 세부 정보는 모델 카드 추가 설명서에서 확인할 수 있습니다.

안전과 투명성에 대한 우리의 약속의 일환으로, 우리는 이번 최신 모델 내의 안전 메커니즘을 테스트하고 개선하기 위해 외부 전문가들과 협력했습니다. 최근에 우리는 Claude 3.5 Sonnet을 영국 인공지능 안전 연구소 (UK AISI)에 제공하여 사전 배치 안전 평가를 받았습니다. UK AISI는 3.5 Sonnet의 테스트를 완료하고 올해 초 미국 AI 안전 연구소 (US AISI)와의 협약에 따라 결과를 공유했습니다. 이는 미국과 영국 AISI 간의 파트너십에 의해 가능해진 것입니다. 올해 초 발표된 내용입니다.

외부 주제 전문가들로부터 정책 피드백을 통합하여 우리의 평가가 견고하며 남용의 새로운 추세를 고려하고 있는지 확인했습니다. 이 협력은 우리의 팀이 다양한 유형의 남용에 대한 3.5 Sonnet의 평가 능력을 확대하도록 도왔습니다. 예를 들어, 우리는 Thorn의 아동 안전 전문가들로부터의 피드백을 활용하여 우리의 분류기를 업데이트하고 모델을 세밀하게 조정했습니다.

우리의 AI 모델 개발을 지도하는 핵심 헌법 원칙 중 하나는 개인 정보 보호입니다. 사용자가 명시적으로 허용하지 않는 한, 우리는 생성 모델을 사용자 제출 데이터로 훈련하지 않습니다. 현재까지 우리는 고객 또는 사용자 제출 데이터를 생성 모델 훈련에 사용한 적이 없습니다.

곧 출시될 예정

우리의 목표는 지능, 속도 및 비용 사이의 교환 곡선을 몇 달마다 실질적으로 개선하는 것입니다. Claude 3.5 모델 패밀리를 완성하기 위해 올해 나중에 Claude 3.5 Haiku와 Claude 3.5 Opus를 출시할 예정입니다.

차세대 모델 패밀리를 개발하는 동시에, 우리는 기업 애플리케이션과의 통합을 포함한 비즈니스용 더 많은 사용 사례를 지원하기 위해 새로운 모달리티와 기능을 개발 중에 있습니다. 우리 팀은 또한 사용자의 선호도와 상호 작용 기록을 지정하여 Claude가 사용자 경험을 더 개인화하고 효율적으로 만들 수 있도록 하는 ‘메모리’와 같은 기능을 탐구 중에 있습니다.

우리는 계속해서 Claude를 개선하기 위해 노력하고 사용자들로부터의 의견을 즐겨합니다. Claude 3.5 Sonnet에 대한 피드백을 제품 내에서 직접 제출하여 개발 로드맵을 안내하고 사용자 경험을 개선하는 데 우리의 팀이 도움을 받을 수 있도록 해주세요. 언제나 Claude로 무엇을 만들고 발견할지 기대하고 있습니다.

이 기사의 내용은 원문 기사에서 번역되었습니다.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다