Categorias
Notícias

 Apresentando Claude 3.5 Sonnet: Definindo novos padrões em IA com inteligência e velocidade aprimoradas

Claude 3.5 Sonnet, o mais recente lançamento na família de modelos Claude 3.5, traz avanços significativos nas capacidades de IA. Ele se destaca em benchmarks de inteligência, opera duas vezes mais rápido do que os modelos anteriores e oferece preços acessíveis. Novos recursos como Artefatos aprimoram a interação do usuário ao fornecer ferramentas de colaboração em tempo real. Medidas de segurança incluem testes rigorosos e engajamento com especialistas externos, garantindo conformidade com os padrões ASL-2 e priorizando a privacidade do usuário. Atualizações futuras incluem os lançamentos de Claude 3.5 Haiku e Claude 3.5 Opus, juntamente com melhorias contínuas para suportar diversas aplicações comerciais e integração de feedback do usuário.

Hoje, estamos lançando o Claude 3.5 Sonnet – nosso primeiro lançamento na próxima família de modelos Claude 3.5. O Claude 3.5 Sonnet eleva o padrão da indústria para inteligência, superando modelos concorrentes e o Claude 3 Opus em uma ampla gama de avaliações, com a velocidade e custo de nosso modelo de nível intermediário, Claude 3 Sonnet.

O Claude 3.5 Sonnet agora está disponível gratuitamente em Claude.ai e no aplicativo Claude iOS, enquanto assinantes dos planos Claude Pro e Team podem acessá-lo com limites significativamente mais altos. Também está disponível via Anthropic API, Amazon Bedrock e Google Cloud’s Vertex AI. O modelo custa $3 por milhão de tokens de entrada e $15 por milhão de tokens de saída, com uma janela de contexto de 200 mil tokens.

Inteligência de vanguarda a 2x a velocidade

O Claude 3.5 Sonnet estabelece novos benchmarks da indústria para raciocínio de nível de pós-graduação (GPQA), conhecimento de nível de graduação (MMLU) e proficiência em codificação (HumanEval). Ele mostra uma melhoria marcante na compreensão de nuances, humor e instruções complexas, e é excepcional na redação de conteúdo de alta qualidade com um tom natural e acessível.

O Claude 3.5 Sonnet opera a duas vezes a velocidade do Claude 3 Opus. Esse impulso de desempenho, combinado com preços acessíveis, torna o Claude 3.5 Sonnet ideal para tarefas complexas como suporte ao cliente sensível ao contexto e orquestração de fluxos de trabalho de vários passos.

Em uma avaliação interna de codificação agente, o Claude 3.5 Sonnet resolveu 64% dos problemas, superando o Claude 3 Opus que resolveu 38%. Nossa avaliação testa a capacidade do modelo de corrigir um bug ou adicionar funcionalidades a uma base de código aberto, dada uma descrição em linguagem natural da melhoria desejada. Quando instruído e fornecido com as ferramentas relevantes, o Claude 3.5 Sonnet pode escrever, editar e executar código de forma independente, com raciocínio sofisticado e capacidades de resolução de problemas. Ele lida com traduções de código com facilidade, tornando-o particularmente eficaz para atualizar aplicativos legados e migrar bases de código.

Visão de ponta

O Claude 3.5 Sonnet é nosso modelo de visão mais avançado até o momento, superando o Claude 3 Opus nos benchmarks padrão de visão. Essas melhorias de mudança de paradigma são mais perceptíveis para tarefas que exigem raciocínio visual, como interpretar gráficos e gráficos. O Claude 3.5 Sonnet também pode transcrever com precisão texto de imagens imperfeitas – uma capacidade fundamental para varejo, logística e serviços financeiros, onde a IA pode extrair mais insights de uma imagem, gráfico ou ilustração do que apenas do texto.

Artefatos – uma nova maneira de usar o Claude

Hoje, também estamos introduzindo Artefatos em Claude.ai, um novo recurso que expande a forma como os usuários podem interagir com Claude. Quando um usuário pede ao Claude para gerar conteúdo como trechos de código, documentos de texto ou designs de website, esses Artefatos aparecem em uma janela dedicada ao lado de sua conversa. Isso cria um espaço de trabalho dinâmico onde eles podem ver, editar e construir sobre as criações do Claude em tempo real, integrando perfeitamente o conteúdo gerado por IA em seus projetos e fluxos de trabalho.

Este recurso de visualização marca a evolução de Claude de uma IA conversacional para um ambiente de trabalho colaborativo. É apenas o início de uma visão mais ampla para o Claude.ai, que em breve se expandirá para apoiar a colaboração em equipe. Em um futuro próximo, equipes – e eventualmente organizações inteiras – poderão centralizar com segurança seu conhecimento, documentos e trabalho em andamento em um espaço compartilhado, com Claude atuando como um parceiro sob demanda.

Compromisso com a segurança e privacidade

Nossos modelos são submetidos a testes rigorosos e foram treinados para reduzir o uso indevido. Apesar do salto de inteligência do Claude 3.5 Sonnet, nossas avaliações de equipe vermelha concluíram que o Claude 3.5 Sonnet permanece em ASL-2. Mais detalhes podem ser encontrados no adendo do cartão do modelo.

Como parte de nosso compromisso com a segurança e transparência, envolvemos especialistas externos para testar e aprimorar os mecanismos de segurança deste último modelo. Recentemente fornecemos o Claude 3.5 Sonnet ao Instituto de Segurança de Inteligência Artificial do Reino Unido (UK AISI) para avaliação de segurança pré-implementação. O UK AISI realizou testes do 3.5 Sonnet e compartilhou seus resultados com o Instituto de Segurança de IA dos EUA (US AISI) como parte de um Memorando de Entendimento, viabilizado pela parceria entre os AISIs dos EUA e do Reino Unido anunciado no início deste ano.

Incorporamos feedback de políticas de especialistas externos para garantir que nossas avaliações sejam robustas e considerem as novas tendências de abuso. Este envolvimento ajudou nossas equipes a ampliar nossa capacidade de avaliar o 3.5 Sonnet contra vários tipos de uso indevido. Por exemplo, usamos feedback de especialistas em segurança infantil em Thorn para atualizar nossos classificadores e ajustar nossos modelos.

Um dos princípios constitucionais fundamentais que orienta o desenvolvimento de nossos modelos de IA é a privacidade. Não treinamos nossos modelos generativos com dados enviados pelo usuário, a menos que o usuário nos dê permissão explícita para fazer isso. Até o momento, não utilizamos nenhum dado de cliente ou usuário enviado para treinar nossos modelos generativos.

Em breve

Nosso objetivo é melhorar substancialmente a curva de troca entre inteligência, velocidade e custo a cada poucos meses. Para completar a família de modelos Claude 3.5, lançaremos o Claude 3.5 Haiku e o Claude 3.5 Opus ainda este ano.

Além de trabalhar em nossa família de modelos de próxima geração, estamos desenvolvendo novas modalidades e recursos para apoiar mais casos de uso para empresas, incluindo integrações com aplicativos corporativos. Nossa equipe também está explorando recursos como Memória, que permitirá que o Claude lembre as preferências e o histórico de interações de um usuário conforme especificado, tornando sua experiência ainda mais personalizada e eficiente.

Estamos constantemente trabalhando para melhorar o Claude e adoramos ouvir nossos usuários. Você pode enviar feedback sobre o Claude 3.5 Sonnet diretamente no produto para informar nosso roteiro de desenvolvimento e ajudar nossas equipes a melhorar sua experiência. Como sempre, estamos ansiosos para ver o que você constrói, cria e descobre com o Claude.

O conteúdo deste artigo foi traduzido do artigo original.

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *