Categorías
Noticias

¿Cuáles son las características de claude 3?

Claude 3 es reconocido por sus capacidades avanzadas en razonamiento, conocimiento experto, matemáticas y tareas de lenguaje, lo que lo convierte en uno de los modelos de IA más inteligentes desarrollado por Anthropic.

Hoy, anunciamos la familia de modelos Claude 3, que establece nuevos estándares en la industria en una amplia gama de tareas cognitivas. La familia incluye tres modelos de última generación en orden ascendente de capacidad: Claude 3 Haiku, Claude 3 Sonnet y Claude 3 Opus. Cada modelo sucesivo ofrece un rendimiento cada vez más potente, permitiendo a los usuarios seleccionar el equilibrio óptimo entre inteligencia, velocidad y coste para su aplicación específica.

Opus y Sonnet ya están disponibles para usar en claude.ai y la API de Claude, la cual ahora está disponible en 159 países. Haiku estará disponible próximamente.

Familia de modelos Claude 3

claude3

Un nuevo estándar en inteligencia

Opus, nuestro modelo más inteligente, supera a sus pares en la mayoría de los benchmarks de evaluación comunes para sistemas de IA, incluyendo conocimiento experto a nivel de pregrado (MMLU), razonamiento experto a nivel de posgrado (GPQA), matemáticas básicas (GSM8K) y más. Exhibe niveles de comprensión y fluidez cercanos a los humanos en tareas complejas, liderando la frontera de la inteligencia general.

Todos los modelos Claude 3 muestran capacidades mejoradas en análisis y pronóstico, creación de contenido matizado, generación de código y conversación en idiomas no ingleses como español, japonés y francés.

A continuación se muestra una comparación de los modelos Claude 3 con los de nuestros competidores en múltiples benchmarks de capacidad:

Resultados casi instantáneos

Los modelos Claude 3 pueden alimentar chats en vivo con clientes, autocompletados y tareas de extracción de datos donde las respuestas deben ser inmediatas y en tiempo real.

Haiku es el modelo más rápido y rentable en el mercado para su categoría de inteligencia. Puede leer un artículo de investigación denso en información y datos en arXiv (~10k tokens) con gráficos en menos de tres segundos. Tras el lanzamiento, esperamos mejorar aún más el rendimiento.

Para la gran mayoría de cargas de trabajo, Sonnet es 2 veces más rápido que Claude 2 y Claude 2.1 con niveles superiores de inteligencia. Sobresale en tareas que requieren respuestas rápidas, como recuperación de conocimiento o automatización de ventas. Opus ofrece velocidades similares a Claude 2 y 2.1, pero con niveles mucho más altos de inteligencia.

Fuertes capacidades visuales

Los modelos Claude 3 tienen sofisticadas capacidades visuales al nivel de otros modelos líderes. Pueden procesar una amplia gama de formatos visuales, incluyendo fotos, gráficos, diagramas técnicos y gráficos. Estamos particularmente entusiasmados de proporcionar esta nueva modalidad a nuestros clientes empresariales, algunos de los cuales tienen hasta el 50% de sus bases de conocimiento codificadas en varios formatos como PDF, diagramas de flujo o diapositivas de presentación.

Menos rechazos

Los modelos Claude anteriores a menudo hacían rechazos innecesarios que sugerían una falta de comprensión contextual. Hemos avanzado significativamente en esta área: Opus, Sonnet y Haiku son significativamente menos propensos a rechazar responder a indicaciones que bordean los límites del sistema que las generaciones anteriores de modelos. Como se muestra a continuación, los modelos Claude 3 muestran una comprensión más matizada de las solicitudes, reconocen el daño real y rechazan responder a indicaciones inofensivas mucho menos frecuentemente.

Precisión mejorada

Empresas de todos los tamaños confían en nuestros modelos para atender a sus clientes, por lo que es imperativo que las salidas de nuestros modelos mantengan una alta precisión a escala. Para evaluar esto, utilizamos un amplio conjunto de preguntas complejas y factuales que apuntan a debilidades conocidas en los modelos actuales. Categorizamos las respuestas en respuestas correctas, respuestas incorrectas (o alucinaciones) y admisiones de incertidumbre, donde el modelo dice que no sabe la respuesta en lugar de proporcionar información incorrecta. En comparación con Claude 2.1, Opus demuestra una mejora del doble en precisión (o respuestas correctas) en estas difíciles preguntas abiertas, al mismo tiempo que exhibe niveles reducidos de respuestas incorrectas.

Además de producir respuestas más confiables, pronto habilitaremos citas en nuestros modelos Claude 3 para que puedan señalar frases precisas en material de referencia para verificar sus respuestas.

Contexto largo y recuerdo casi perfecto

La familia de modelos Claude 3 ofrecerá inicialmente una ventana de contexto de 200K al momento del lanzamiento. Sin embargo, los tres modelos son capaces de aceptar entradas que superan los 1 millón de tokens y podemos hacer esto disponible para clientes selectos que necesiten una potencia de procesamiento mejorada.

Para procesar indicaciones de contexto largo de manera efectiva, los modelos requieren capacidades sólidas de recuerdo. La evaluación ‘Aguja en un pajar’ (NIAH) mide la capacidad de un modelo para recordar información con precisión de un vasto corpus de datos. Mejoramos la robustez de este benchmark utilizando uno de 30 pares aleatorios de aguja/pregunta por indicación y probando en un corpus diverso de documentos colaborativos. Claude 3 Opus no solo logró un recuerdo casi perfecto, superando el 99% de precisión, sino que en algunos casos, incluso identificó las limitaciones de la evaluación misma al reconocer que la oración ‘aguja’ parecía estar insertada artificialmente en el texto original por un humano.

Diseño responsable

Hemos desarrollado la familia de modelos Claude 3 para ser tan confiables como capaces. Contamos con varios equipos dedicados a rastrear y mitigar un amplio espectro de riesgos, que van desde la desinformación y el CSAM hasta el uso biológico, la interferencia electoral y las habilidades de replicación autónoma. Continuamos desarrollando métodos como Inteligencia Artificial Constitucional que mejoran la seguridad y transparencia de nuestros modelos, y hemos ajustado nuestros modelos para mitigar problemas de privacidad que podrían surgir con nuevas modalidades.

Abordar los sesgos en modelos cada vez más sofisticados es un esfuerzo continuo y hemos avanzado con este nuevo lanzamiento. Como se muestra en la tarjeta de modelo, Claude 3 muestra menos sesgos que nuestros modelos anteriores según el Benchmark de Sesgos para Respuestas a Preguntas (BBQ). Seguimos comprometidos en desarrollar técnicas que reduzcan sesgos y promuevan una mayor neutralidad en nuestros modelos, garantizando que no estén sesgados hacia ninguna postura partidista en particular.

Aunque la familia de modelos Claude 3 ha avanzado en medidas clave de conocimiento biológico, conocimiento cibernético y autonomía en comparación con modelos anteriores, sigue clasificándose en el Nivel de Seguridad de IA 2 (ASL-2) según nuestra Política de Escalado Responsable. Nuestras evaluaciones de equipo rojo (realizadas de acuerdo con nuestros compromisos de la Casa Blanca y el Decreto Ejecutivo de EE. UU. de 2023) han concluido que los modelos presentan un potencial de riesgo catastrófico insignificante en este momento. Continuaremos monitoreando cuidadosamente los modelos futuros para evaluar su proximidad al umbral ASL-3. Más detalles de seguridad están disponibles en la tarjeta de modelo Claude 3.

Más fácil de usar

Los modelos Claude 3 son mejores siguiendo instrucciones complejas y multi-paso. Son particularmente hábiles en seguir la voz de la marca y las pautas de respuesta, y en desarrollar experiencias orientadas al cliente en las que nuestros usuarios puedan confiar. Además, los modelos Claude 3 son mejores en producir salidas estructuradas populares en formatos como JSON, lo que simplifica instruir a Claude para casos de uso como clasificación de lenguaje natural y análisis de sentimientos.

Detalles del modelo

Claude 3 Opus es nuestro modelo más inteligente, con el mejor rendimiento del mercado en tareas altamente complejas. Puede manejar de forma fluida y con comprensión similar a la humana mensajes abiertos y escenarios no vistos previamente. Opus nos muestra los límites de lo posible con la IA generativa.

Costo

[Entrada $/millón de tokens | Salida $/millón de tokens]

$15 | $75
Ventana de contexto 200K*
Usos potenciales Automatización de tareas: planificar y ejecutar acciones complejas a través de APIs y bases de datos, codificación interactivaI+D: revisión de investigaciones, lluvia de ideas y generación de hipótesis, descubrimiento de fármacosEstrategia: análisis avanzado de gráficos y tendencias de mercado, pronóstico
Diferenciador Inteligencia superior a cualquier otro modelo disponible.

*1M de tokens disponibles para casos de uso específicos, consulte.

Claude 3 Sonnet encuentra el equilibrio ideal entre inteligencia y velocidad, especialmente para cargas de trabajo empresariales. Ofrece un rendimiento sólido a un costo menor en comparación con sus pares, y está diseñado para una alta resistencia en implementaciones de IA a gran escala.

Costo

[Entrada $/millón de tokens | Salida $/millón de tokens]

$3 | $15
Ventana de contexto 200K
Usos potenciales Procesamiento de datos: RAG o búsqueda y recuperación sobre vastas cantidades de conocimientoVentas: recomendaciones de productos, pronósticos, marketing dirigidoTareas que ahorran tiempo: generación de código, control de calidad, análisis de texto de imágenes
Diferenciador Más asequible que otros modelos con inteligencia similar; mejor para escalar.

Claude 3 Haiku es nuestro modelo más rápido y compacto para una capacidad de respuesta casi instantánea. Responde a consultas y solicitudes simples con una velocidad inigualable. Los usuarios podrán crear experiencias de IA fluidas que imitan interacciones humanas.

Costo

[Entrada $/millón de tokens | Salida $/millón de tokens]

$0.25 | $1.25
Ventana de contexto 200K
Usos potenciales Interacciones con clientes: soporte rápido y preciso en interacciones en vivo, traduccionesModeración de contenido: detectar comportamientos arriesgados o solicitudes de clientesTareas de ahorro de costos: logística optimizada, gestión de inventario, extraer conocimiento de datos no estructurados
Diferenciador Más inteligente, más rápido y más asequible que otros modelos en su categoría de inteligencia.

Disponibilidad del modelo

Opus y Sonnet están disponibles para usar hoy en nuestra API, que ahora está disponible en general, permitiendo a los desarrolladores registrarse y comenzar a usar estos modelos de inmediato. Haiku estará disponible pronto. Sonnet está impulsando la experiencia gratuita en claude.ai, con Opus disponible para los suscriptores de Claude Pro.

Sonnet también está disponible hoy a través de Amazon Bedrock y en vista previa privada en el Jardín de Modelos de Vertex AI de Google Cloud, con Opus y Haiku próximamente en ambos.

Más inteligente, más rápido, más seguro

No creemos que la inteligencia de los modelos esté cerca de sus límites, y planeamos lanzar actualizaciones frecuentes a la familia de modelos Claude 3 en los próximos meses. También estamos emocionados de lanzar una serie de características para mejorar las capacidades de nuestros modelos, especialmente para casos de uso empresariales e implementaciones a gran escala. Estas nuevas características incluirán Uso de Herramientas (también conocido como llamada de funciones), codificación interactiva (también conocida como REPL) y capacidades agentivas más avanzadas.

A medida que empujamos los límites de las capacidades de la IA, también estamos comprometidos a garantizar que nuestros protectores de seguridad se mantengan al día con estos avances en rendimiento. Nuestra hipótesis es que estar en la frontera del desarrollo de la IA es la forma más efectiva de dirigir su trayectoria hacia resultados societales positivos.

Estamos emocionados por ver lo que crearás con Claude 3 y esperamos que nos des tu opinión para hacer de Claude un asistente aún más útil y compañero creativo. Para comenzar a construir con Claude, visita anthropic.com/claude.

Notas al pie

  1. Esta tabla muestra comparaciones con modelos actualmente disponibles comercialmente que han lanzado evaluaciones. Nuestra tarjeta de modelo muestra comparaciones con modelos que han sido anunciados pero aún no han sido lanzados, como Gemini 1.5 Pro. Además, nos gustaría señalar que los ingenieros han trabajado para optimizar los mensajes y muestras de pocos disparos para evaluaciones y han reportado puntajes más altos para un modelo GPT-4T más reciente. Fuente.

El contenido de este artículo fue traducido de la artículo original

Una respuesta a «¿Cuáles son las características de claude 3?»

I was very pleased to find this web-site.I wanted to thanks for your time for this wonderful read!! I definitely enjoying every little bit of it and I have you bookmarked to check out new stuff you blog post.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *