Categorias
Notícias

Quais são as características do Claude 3

O Claude 3 é reconhecido por suas capacidades avançadas em raciocínio, conhecimento especializado, matemática e tarefas de linguagem, tornando-o um dos modelos de IA mais inteligentes desenvolvidos pela Anthropic

Hoje, estamos anunciando a família de modelos Claude 3, que estabelece novos padrões na indústria em uma ampla gama de tarefas cognitivas. A família inclui três modelos de ponta em ordem crescente de capacidade: Claude 3 Haiku, Claude 3 Sonnet e Claude 3 Opus. Cada modelo sucessivo oferece um desempenho cada vez mais poderoso, permitindo aos usuários selecionar o equilíbrio ideal entre inteligência, velocidade e custo para sua aplicação específica.

Opus e Sonnet estão agora disponíveis para uso em claude.ai e na Claude API, que agora está disponível em 159 países. Haiku estará disponível em breve.

Família de modelos Claude 3

claude3

Um novo padrão para inteligência

Opus, nosso modelo mais inteligente, supera seus pares na maioria dos benchmarks de avaliação comuns para sistemas de IA, incluindo conhecimento especializado de nível universitário (MMLU), raciocínio especializado de nível de pós-graduação (GPQA), matemática básica (GSM8K) e muito mais. Ele exibe níveis de compreensão e fluência próximos aos humanos em tarefas complexas, liderando a fronteira da inteligência geral.

Todos os modelos Claude 3

Abaixo está uma comparação dos modelos Claude 3 com os de nossos concorrentes em múltiplos benchmarks [1] de capacidade:

Resultados quase instantâneos

Os modelos Claude 3 podem alimentar chats ao vivo com clientes, autocompletar tarefas e extração de dados onde as respostas devem ser imediatas e em tempo real.

Haiku é o modelo mais rápido e mais eficaz em termos de custo no mercado para sua categoria de inteligência. Ele pode ler um artigo de pesquisa denso em informações e dados no arXiv (~10k tokens) com gráficos e diagramas em menos de três segundos. Após o lançamento, esperamos melhorar ainda mais o desempenho.

Para a grande maioria das cargas de trabalho, Sonnet é 2x mais rápido que Claude 2 e Claude 2.1 com níveis mais altos de inteligência. Ele se destaca em tarefas que exigem respostas rápidas, como recuperação de conhecimento ou automação de vendas. Opus oferece velocidades semelhantes às de Claude 2 e 2.1, mas com níveis muito mais altos de inteligência.

Fortes capacidades de visão

Os modelos Claude 3 possuem sofisticadas capacidades de visão em paridade com outros modelos líderes. Eles podem processar uma ampla gama de formatos visuais, incluindo fotos, gráficos, diagramas técnicos e técnicos. Estamos particularmente entusiasmados em fornecer essa nova modalidade aos nossos clientes corporativos, alguns dos quais têm até 50% de suas bases de conhecimento codificadas em vários formatos, como PDFs, fluxogramas ou slides de apresentação.

Menos recusas

Os modelos Claude anteriores frequentemente faziam recusas desnecessárias que sugeriam uma falta de compreensão contextual. Fizemos progressos significativos nessa área: Opus, Sonnet e Haiku são significativamente menos propensos a recusar responder a prompts que ultrapassam os limites do sistema do que gerações anteriores de modelos. Como mostrado abaixo, os modelos Claude 3 mostram uma compreensão mais sutil de solicitações, reconhecem danos reais e recusam responder a prompts inofensivos com muito menos frequência.

Precisão aprimorada

Empresas de todos os tamanhos contam com nossos modelos para atender seus clientes, tornando imperativo que as saídas de nossos modelos mantenham alta precisão em escala. Para avaliar isso, usamos um grande conjunto de perguntas complexas e factuais que visam fraquezas conhecidas em modelos atuais. Categorizamos as respostas em respostas corretas, respostas incorretas (ou alucinações) e admissões de incerteza, onde o modelo diz que não sabe a resposta em vez de fornecer informações incorretas. Em comparação com Claude 2.1, Opus demonstra um aprimoramento de duas vezes na precisão (ou respostas corretas) nessas perguntas desafiadoras de resposta aberta, enquanto também exibe níveis reduzidos de respostas incorretas.

Além de produzir respostas mais confiáveis, em breve permitiremos citações em nossos modelos Claude 3 para que eles possam apontar para frases precisas em material de referência para verificar suas respostas.

Contexto longo e recall quase perfeito

A família de modelos Claude 3 oferecerá inicialmente uma janela de contexto de 200 mil tokens após o lançamento. No entanto, todos os três modelos são capazes de aceitar entradas que excedem 1 milhão de tokens e podemos disponibilizar isso para clientes selecionados que precisam de maior potência de processamento.

Para processar prompts de contexto longo de forma eficaz, os modelos requerem robustas capacidades de recall. A avaliação ‘Needle In A Haystack’ (NIAH) mede a capacidade de um modelo de lembrar com precisão informações de um vasto corpus de dados. Aprimoramos a robustez desse benchmark usando um dos 30 pares de agulhas/perguntas aleatórios por prompt e testando em um corpus diversificado de documentos colaborativos. O Opus do Claude 3 não apenas alcançou um recall quase perfeito, superando 99% de precisão, mas em alguns casos, até identificou as limitações da avaliação ao reconhecer que a frase “agulha” parecia ter sido inserida artificialmente no texto original por um humano.

Design responsável

Desenvolvemos a família de modelos Claude 3 para serem tão confiáveis quanto capazes. Temos várias equipes dedicadas que rastreiam e mitigam uma ampla gama de riscos, que vão desde desinformação e CSAM até uso biológico indevido, interferência eleitoral e habilidades de replicação autônoma. Continuamos a desenvolver métodos como a IA Constitucional que melhoram a segurança e transparência de nossos modelos, e ajustamos nossos modelos para mitigar problemas de privacidade que poderiam surgir com novas modalidades.

Abordar vieses em modelos cada vez mais sofisticados é um esforço contínuo e fizemos avanços com este novo lançamento. Como mostrado no cartão do modelo, o Claude 3 apresenta menos vieses do que nossos modelos anteriores de acordo com o Benchmark de Viés para Resposta a Perguntas (BBQ). Mantemos nosso compromisso de avançar em técnicas que reduzem vieses e promovem maior neutralidade em nossos modelos, garantindo que não estejam inclinados para nenhuma postura partidária específica.

Embora a família de modelos Claude 3 tenha avançado em medidas-chave de conhecimento biológico, conhecimento relacionado a ciber e autonomia em comparação com modelos anteriores, ela permanece no Nível de Segurança de IA 2 (ASL-2) de acordo com nossa Política de Escalonamento Responsável. Nossas avaliações de equipe vermelha (realizadas de acordo com nossos compromissos da Casa Branca e a Ordem Executiva dos EUA de 2023) concluíram que os modelos apresentam um potencial negligenciável de risco catastrófico neste momento. Continuaremos a monitorar cuidadosamente os modelos futuros para avaliar sua proximidade ao limiar ASL-3. Mais detalhes de segurança estão disponíveis no cartão do modelo Claude 3.

Mais fácil de usar

Os modelos Claude 3 são melhores em seguir instruções complexas e multi-etapas. Eles são particularmente hábeis em aderir à voz da marca e diretrizes de resposta, e em desenvolver experiências voltadas para o cliente em que os usuários podem confiar. Além disso, os modelos Claude 3 são melhores em produzir saídas estruturadas populares em formatos como JSON, tornando mais simples instruir Claude para casos de uso como classificação de linguagem natural e análise de sentimentos.

Detalhes do modelo

Claude 3 Opus é nosso modelo mais inteligente, com melhor desempenho no mercado em tarefas altamente complexas. Ele pode navegar por prompts abertos e cenários não vistos com fluidez notável e compreensão semelhante à humana. Opus nos mostra os limites do possível com IA generativa.

Custo

[Entrada $/milhão de tokens | Saída $/milhão de tokens]

$15 | $75
Janela de contexto 200K*
Usos potenciais Automatização de tarefas: planejar e executar ações complexas em APIs e bancos de dados, codificação interativaP&D: revisão de pesquisa, brainstorming e geração de hipóteses, descoberta de medicamentosEstratégia: análise avançada de gráficos e tendências de mercado, previsão
Diferenciador Inteligência superior a qualquer outro modelo disponível.

*1M tokens disponíveis para casos de uso específicos, favor consultar.

Claude 3 Sonnet atinge o equilíbrio ideal entre inteligência e rapidez, especialmente para cargas de trabalho empresariais. Ele oferece alto desempenho a um custo menor em comparação com seus pares e é projetado para alta resistência em implementações de IA em grande escala.

Custo

[Entrada $/milhão de tokens | Saída $/milhão de tokens]

$3 | $15
Janela de contexto 200K
Usos potenciais Processamento de dados: RAG ou busca e recuperação sobre vastas quantidades de conhecimentoVendas: recomendações de produtos, previsão, marketing direcionadoTarefas de economia de tempo: geração de código, controle de qualidade, análise de texto de imagens
Diferenciador Mais acessível do que outros modelos com inteligência semelhante; melhor para escalabilidade.

Claude 3 Haiku é nosso modelo mais rápido e compacto para resposta quase instantânea. Ele responde a consultas e solicitações simples com velocidade incomparável. Os usuários poderão construir experiências de IA contínuas que imitam interações humanas.

Custo

[Entrada $/milhão de tokens | Saída $/milhão de tokens]

$0.25 | $1.25
Janela de contexto 200K
Usos potenciais Interações com clientes: suporte rápido e preciso em interações ao vivo, traduçõesModeração de conteúdo: identificar comportamentos arriscados ou solicitações de clientesTarefas de economia de custos: logística otimizada, gestão de estoque, extrair conhecimento de dados não estruturados
Diferenciador Mais inteligente, mais rápido e mais acessível do que outros modelos em sua categoria de inteligência.

Disponibilidade do modelo

Opus e Sonnet estão disponíveis para uso hoje em nossa API, que agora está geralmente disponível, permitindo que os desenvolvedores se inscrevam e comecem a usar esses modelos imediatamente. Haiku estará disponível em breve. Sonnet está alimentando a experiência gratuita em claude.ai, com Opus disponível para assinantes do Claude Pro.

Sonnet também está disponível hoje através do Amazon Bedrock e em visualização privada no Google Cloud Vertex AI Model Garden, com Opus e Haiku chegando em breve em ambos.

Mais inteligente, mais rápido, mais seguro

Não acreditamos que a inteligência do modelo esteja perto de seus limites, e planejamos lançar atualizações frequentes para a família de modelos Claude 3 nos próximos meses. Estamos igualmente entusiasmados em lançar uma série de recursos para aprimorar as capacidades de nossos modelos, especialmente para casos de uso empresariais e implementações em grande escala. Esses novos recursos incluirão Uso de Ferramentas (também conhecido como chamada de função), codificação interativa (também conhecida como REPL) e capacidades agenticas mais avançadas.

Ao empurrarmos os limites das capacidades de IA, estamos igualmente comprometidos em garantir que nossos guarda-rails de segurança acompanhem esses avanços de desempenho. Nossa hipótese é que estar na fronteira do desenvolvimento de IA é a maneira mais eficaz de direcionar sua trajetória para resultados sociais positivos.

Estamos animados para ver o que você cria com o Claude 3 e esperamos que você nos dê feedback para tornar o Claude um assistente e companheiro criativo ainda mais útil. Para começar a construir com o Claude, visite anthropic.com/claude.

Notas de rodapé

  1. Esta tabela mostra comparações com modelos atualmente disponíveis comercialmente que lançaram avaliações. Nosso cartão de modelo mostra comparações com modelos que foram anunciados, mas ainda não lançados, como o Gemini 1.5 Pro. Além disso, gostaríamos de observar que os engenheiros trabalharam para otimizar prompts e amostras de poucas etapas para avaliações e relataram pontuações mais altas para um modelo GPT-4T mais recente. Fonte.

O conteúdo deste artigo foi traduzido do artigo original

Um comentário a “Quais são as características do Claude 3”

It’s really a great and useful piece of info. I’m glad that you shared this helpful info with us. Please keep us up to date like this. Thanks for sharing.

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *