Categorías
Noticias

Presentando Claude 3.5 Sonnet: Estableciendo nuevos estándares en IA con una inteligencia y velocidad mejoradas

Claude 3.5 Sonnet, la última versión de la familia de modelos Claude 3.5, introduce avances significativos en capacidades de IA. Sobresale en pruebas de inteligencia, opera el doble de rápido que los modelos anteriores y ofrece precios rentables. Nuevas características como Artifacts mejoran la interacción del usuario al proporcionar herramientas de colaboración en tiempo real. Las medidas de seguridad incluyen pruebas rigurosas y la participación de expertos externos, asegurando el cumplimiento de los estándares ASL-2 y priorizando la privacidad del usuario. Las actualizaciones futuras incluyen los lanzamientos de Claude 3.5 Haiku y Claude 3.5 Opus, junto con mejoras continuas para respaldar diversas aplicaciones empresariales e integración de retroalimentación de los usuarios.

Hoy, lanzamos Claude 3.5 Sonnet, nuestra primera versión en la próxima familia de modelos Claude 3.5. Claude 3.5 Sonnet eleva el estándar de la industria en inteligencia, superando a modelos competidores y a Claude 3 Opus en una amplia gama de evaluaciones, con la velocidad y el costo de nuestro modelo de nivel medio, Claude 3 Sonnet.

Claude 3.5 Sonnet ahora está disponible de forma gratuita en Claude.ai y en la aplicación Claude iOS, mientras que los suscriptores de los planes Claude Pro y Team pueden acceder a él con límites significativamente más altos. También está disponible a través de la API de Anthropic, Amazon Bedrock y la IA de Google Cloud Vertex. El modelo cuesta $3 por millón de tokens de entrada y $15 por millón de tokens de salida, con una ventana de contexto de 200K tokens.

Inteligencia de vanguardia a 2 veces la velocidad

Claude 3.5 Sonnet establece nuevos estándares de la industria para el razonamiento a nivel de posgrado (GPQA), conocimiento a nivel de pregrado (MMLU) y competencia en programación (HumanEval). Muestra una mejora notable en la comprensión de matices, humor e instrucciones complejas, y es excepcional en la redacción de contenido de alta calidad con un tono natural y relatable.

Claude 3.5 Sonnet opera a doble velocidad que Claude 3 Opus. Este impulso en el rendimiento, combinado con precios rentables, hace que Claude 3.5 Sonnet sea ideal para tareas complejas como el soporte al cliente sensible al contexto y la orquestación de flujos de trabajo multifásicos.

En una evaluación de codificación agente interna, Claude 3.5 Sonnet resolvió el 64% de los problemas, superando a Claude 3 Opus que resolvió el 38%. Nuestra evaluación prueba la capacidad del modelo para corregir un error o agregar funcionalidad a una base de código de código abierto, dada una descripción en lenguaje natural de la mejora deseada. Cuando se instruye y se le proporcionan las herramientas relevantes, Claude 3.5 Sonnet puede escribir, editar y ejecutar código de forma independiente con razonamiento sofisticado y capacidades de resolución de problemas. Maneja traducciones de código con facilidad, lo que lo hace particularmente efectivo para actualizar aplicaciones heredadas y migrar bases de código.

Visión de última generación

Claude 3.5 Sonnet es nuestro modelo de visión más sólido hasta la fecha, superando a Claude 3 Opus en pruebas de visión estándar. Estas mejoras de cambio de paso son más notables para tareas que requieren razonamiento visual, como interpretar gráficos y gráficos. Claude 3.5 Sonnet también puede transcribir con precisión texto de imágenes imperfectas, una capacidad fundamental para el comercio minorista, la logística y los servicios financieros, donde la IA puede obtener más información de una imagen, gráfico o ilustración que solo del texto.

Artifacts: una nueva forma de usar Claude

Hoy también presentamos Artifacts en Claude.ai, una nueva función que amplía la forma en que los usuarios pueden interactuar con Claude. Cuando un usuario le pide a Claude que genere contenido como fragmentos de código, documentos de texto o diseños de sitios web, estos Artifacts aparecen en una ventana dedicada junto a su conversación. Esto crea un espacio de trabajo dinámico donde pueden ver, editar y construir sobre las creaciones de Claude en tiempo real, integrando de manera fluida contenido generado por IA en sus proyectos y flujos de trabajo.

Esta función de vista previa marca la evolución de Claude de una IA conversacional a un entorno de trabajo colaborativo. Es solo el comienzo de una visión más amplia para Claude.ai, que pronto se expandirá para apoyar la colaboración en equipo. En un futuro cercano, los equipos, y eventualmente organizaciones enteras, podrán centralizar de forma segura sus conocimientos, documentos y trabajo en curso en un espacio compartido, con Claude actuando como un compañero de equipo a pedido.

Compromiso con la seguridad y privacidad

Nuestros modelos están sujetos a rigurosas pruebas y han sido entrenados para reducir el mal uso. A pesar del salto en inteligencia de Claude 3.5 Sonnet, nuestras evaluaciones de red teaming han concluido que Claude 3.5 Sonnet sigue en ASL-2. Pueden encontrarse más detalles en el anexo de la tarjeta de modelo.

Como parte de nuestro compromiso con la seguridad y transparencia, hemos colaborado con expertos externos para probar y refinar los mecanismos de seguridad dentro de este último modelo. Recientemente proporcionamos Claude 3.5 Sonnet al Instituto de Seguridad de Inteligencia Artificial del Reino Unido (UK AISI) para evaluación de seguridad previa a la implementación. El UK AISI realizó pruebas de 3.5 Sonnet y compartió sus resultados con el Instituto de Seguridad de Inteligencia Artificial de EE. UU. (US AISI) como parte de un Memorando de Entendimiento, hecho posible por la asociación entre los AISIs de EE. UU. y del Reino Unido anunciada a principios de este año.

Hemos integrado retroalimentación de políticas de expertos externos en la materia para garantizar que nuestras evaluaciones sean sólidas y tengan en cuenta las nuevas tendencias de abuso. Esta colaboración ha ayudado a nuestros equipos a aumentar nuestra capacidad para evaluar 3.5 Sonnet contra varios tipos de mal uso. Por ejemplo, utilizamos la retroalimentación de expertos en seguridad infantil en Thorn para actualizar nuestros clasificadores y afinar nuestros modelos.

Uno de los principios constitucionales fundamentales que guía el desarrollo de nuestro modelo de IA es la privacidad. No entrenamos nuestros modelos generativos en datos enviados por los usuarios a menos que un usuario nos dé permiso explícito para hacerlo. Hasta la fecha, no hemos utilizado ningún dato enviado por clientes o usuarios para entrenar nuestros modelos generativos.

Próximamente

Nuestro objetivo es mejorar sustancialmente la curva de intercambio entre inteligencia, velocidad y costo cada pocos meses. Para completar la familia de modelos de Claude 3.5, lanzaremos Claude 3.5 Haiku y Claude 3.5 Opus más adelante este año.

Además de trabajar en nuestra familia de modelos de próxima generación, estamos desarrollando nuevas modalidades y funciones para respaldar más casos de uso para empresas, incluidas integraciones con aplicaciones empresariales. Nuestro equipo también está explorando funciones como Memoria, que permitirá a Claude recordar las preferencias e historial de interacción de un usuario como se especifique, haciendo que su experiencia sea aún más personalizada y eficiente.

Estamos trabajando constantemente para mejorar a Claude y nos encanta escuchar a nuestros usuarios. Puedes enviar comentarios sobre Claude 3.5 Sonnet directamente en el producto para informar nuestro plan de desarrollo y ayudar a nuestros equipos a mejorar tu experiencia. Como siempre, esperamos ver qué construyes, creas y descubres con Claude.

El contenido de este artículo fue traducido del artículo original

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *