Рубрики
Новости

 Представляем Claude 3.5 Sonnet: установление новых стандартов в области искусственного интеллекта с улучшенным интеллектом и скоростью

Claude 3.5 Sonnet, последний релиз в семействе моделей Claude 3.5, вводит значительные усовершенствования в области возможностей искусственного интеллекта. Он превосходит стандарты интеллекта, работает вдвое быстрее предыдущих моделей и предлагает доступные цены. Новые функции, такие как Артефакты, улучшают взаимодействие пользователя, предоставляя инструменты для совместной работы в реальном времени. Меры безопасности включают в себя тщательное тестирование и взаимодействие с внешними экспертами, обеспечивая соответствие стандартам ASL-2 и приоритизацию конфиденциальности пользователей. Будущие обновления включают выпуск моделей Claude 3.5 Haiku и Claude 3.5 Opus, а также постоянные улучшения для поддержки различных бизнес-приложений и интеграции обратной связи пользователей.

Сегодня мы запускаем Claude 3.5 Sonnet—наш первый релиз в предстоящем семействе моделей Claude 3.5. Claude 3.5 Sonnet повышает отраслевой уровень интеллекта, превосходя конкурентные модели и Claude 3 Opus в широком диапазоне оценок, со скоростью и ценой нашей модели среднего уровня, Claude 3 Sonnet.

Claude 3.5 Sonnet теперь доступен бесплатно на Claude.ai и в приложении Claude для iOS, в то время как абоненты планов Claude Pro и Team могут получить доступ к нему с значительно более высокими лимитами запросов. Он также доступен через API Anthropic, Amazon Bedrock и Google Cloud Vertex AI. Стоимость модели составляет $3 за миллион входных токенов и $15 за миллион выходных токенов, с окном контекста из 200 тыс. токенов.

Фронтальный интеллект в 2 раза быстрее

Claude 3.5 Sonnet устанавливает новые отраслевые стандарты для уровня аспиранта (GPQA), уровня бакалавра (MMLU) и владения кодированием (HumanEval). Он проявляет заметное улучшение в понимании нюансов, юмора и сложных инструкций, а также отличается в написании качественного контента с естественным, близким к читателю тоном.

Claude 3.5 Sonnet работает вдвое быстрее Claude 3 Opus. Этот прирост производительности, в сочетании с доступными ценами, делает Claude 3.5 Sonnet идеальным для выполнения сложных задач, таких как контекстно-чувствительная поддержка клиентов и оркестрация многоэтапных рабочих процессов.

В внутренней агентной оценке кодирования Claude 3.5 Sonnet решал 64% проблем, превосходя Claude 3 Opus, который решал 38%. Наша оценка проверяет способность модели исправить ошибку или добавить функциональность в базу открытого исходного кода, имея описание желаемого улучшения на естественном языке. При инструктировании и предоставлении соответствующих инструментов Claude 3.5 Sonnet может самостоятельно писать, редактировать и выполнять код с совершенным рассуждением и возможностями устранения неполадок. Он легко обрабатывает переводы кода, что делает его особенно эффективным для обновления устаревших приложений и миграции кодовых баз.

Современное видение

Claude 3.5 Sonnet — это наша самая мощная модель видения на сегодняшний день, превосходящая Claude 3 Opus по стандартным бенчмаркам видения. Эти кардинальные улучшения особенно заметны для задач, требующих визуального мышления, таких как интерпретация диаграмм и графиков. Claude 3.5 Sonnet также может точно транскрибировать текст с неидеальных изображений — ключевая способность для розничной торговли, логистики и финансовых услуг, где искусственный интеллект может извлечь больше информации из изображения, графики или иллюстрации, чем только из текста.

Артефакты—новый способ использования Claude

Сегодня мы также представляем Артефакты на Claude.ai, новую функцию, которая расширяет способы взаимодействия пользователей с Claude. Когда пользователь просит Claude создать контент, такой как фрагменты кода, текстовые документы или дизайны веб-сайтов, эти Артефакты появляются в отдельном окне наряду с их беседой. Это создает динамическое рабочее пространство, где они могут видеть, редактировать и развивать творения Claude в реальном времени, плавно интегрируя контент, созданный искусственным интеллектом, в свои проекты и рабочие процессы.

Эта функция предварительного просмотра отмечает эволюцию Клода от разговорного искусственного интеллекта до совместной рабочей среды. Это только начало более широкого видения для Claude.ai, который вскоре будет расширяться для поддержки совместной работы в команде. В недалеком будущем команды, а затем целые организации, смогут безопасно централизовать свои знания, документы и текущую работу в одном общем пространстве, при этом Claude будет выступать в роли партнера по запросу.

Обязательство к безопасности и конфиденциальности

Наши модели проходят строгие испытания и были обучены для снижения злоупотреблений. Несмотря на скачок интеллекта в Клоде 3.5 Сонет, наши оценки команды «красных» показали, что Клод 3.5 Сонет остается на уровне ASL-2. Более подробную информацию можно найти в дополнении к модельной карте.

В рамках нашего обязательства к безопасности и прозрачности, мы сотрудничаем с внешними экспертами для тестирования и усовершенствования механизмов безопасности в этой последней модели. Недавно мы предоставили Клод 3.5 Сонет Институту искусственного интеллекта Великобритании (UK AISI) для предварительной проверки безопасности перед внедрением. UK AISI завершил тесты 3.5 Сонет и поделился результатами с Институтом безопасности искусственного интеллекта США (US AISI) в рамках Соглашения о взаимопонимании, возможного благодаря партнерству между US и UK AISI, объявленному ранее в этом году.

Мы внедрили обратную связь по политике от внешних экспертов по предметам, чтобы гарантировать, что наши оценки являются надежными и учитывают новые тенденции в злоупотреблении. Это сотрудничество помогло нашим командам увеличить наши возможности оценки 3.5 Сонет на предмет различных видов злоупотребления. Например, мы использовали обратную связь от экспертов по безопасности детей в Thorn для обновления наших классификаторов и настройки наших моделей.

Одним из основных принципов, определяющих развитие наших моделей искусственного интеллекта, является конфиденциальность. Мы не обучаем наши генеративные модели на данных, предоставленных пользователями, если пользователь явно не дает нам на это разрешение. До настоящего времени мы не использовали данные клиентов или пользователей для обучения наших генеративных моделей.

Скоро в продаже

Нашей целью является существенное улучшение кривой компромисса между интеллектом, скоростью и стоимостью каждые несколько месяцев. Чтобы завершить семейство моделей Клод 3.5, мы планируем выпустить Клод 3.5 Хайку и Клод 3.5 Опус в конце этого года.

Помимо работы над нашим семейством моделей следующего поколения, мы разрабатываем новые модальности и функции для поддержки большего количества случаев использования в бизнесе, включая интеграцию с корпоративными приложениями. Наша команда также исследует функции, такие как Память, которая позволит Клоду запоминать предпочтения пользователя и историю взаимодействия по его указанию, делая их опыт еще более персонализированным и эффективным.

Мы постоянно работаем над улучшением Клода и с удовольствием слушаем наших пользователей. Вы можете отправлять отзывы о Клоде 3.5 Сонет непосредственно в продукт, чтобы информировать наш план развития и помочь нашим командам улучшить ваш опыт. Как всегда, мы с нетерпением ждем, чтобы увидеть, что вы построите, создадите и откроете с помощью Клода.

Содержание этой статьи было переведено с оригинальной статьи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *