التصنيفات
أخبار

ما هي ميزات كلود 3؟

يُعترف بكلود 3 بقدراته المتقدمة في التفكير والمعرفة الخبيرة والرياضيات ومهام اللغة، مما يجعله أحد أذكى نماذج الذكاء الاصطناعي التي طورتها Anthropic.

اليوم، نعلن عن عائلة نماذج كلود 3، التي تضع معايير جديدة في الصناعة عبر مجموعة واسعة من المهام العقلية. تتضمن العائلة ثلاثة نماذج حديثة الصنع بتتابع قدرات متزايد: كلود 3 هايكو، كلود 3 سونيت، وكلود 3 أوبوس. يقدم كل نموذج تحسينًا في الأداء يتزايد تدريجيًا، مما يتيح للمستخدمين اختيار التوازن المثالي بين الذكاء والسرعة والتكلفة لتطبيقهم الخاص.

أصبح بإمكانك الآن استخدام أوبوس وسونيت في claude.ai وواجهة برمجة التطبيقات Claude API التي أصبحت متاحة عمومًا في 159 دولة. سيكون هايكو متاحًا قريبًا.

عائلة نماذج كلود 3

claude3

معيار جديد للذكاء

أوبوس، نموذجنا الأكثر ذكاءً، يتفوق على نظرائه في معظم معايير التقييم الشائعة لأنظمة الذكاء الاصطناعي، بما في ذلك المعرفة الخبيرة على مستوى البكالوريوس (MMLU)، والتفكير الخبير على مستوى الدراسات العليا (GPQA)، والرياضيات الأساسية (GSM8K)، وغيرها. يظهر مستويات تفاهم وفصاحة تقترب من مستويات البشر في المهام المعقدة، مما يقود الحدود في مجال الذكاء العام.

جميع نماذج Claude 3 تظهر قدرات متزايدة في التحليل والتنبؤ وإنشاء المحتوى الدقيق وإنشاء الرموز التشعبية، والتحدث باللغات غير الإنجليزية مثل الإسبانية واليابانية والفرنسية.

أدناه مقارنة بين نماذج Claude 3 ونظرائها في عدة معايير [1] من القدرة:

نتائج فورية تقريبًا

يمكن لنماذج Claude 3 تشغيل محادثات العملاء المباشرة، وإكمال الجمل تلقائيًا، ومهام استخراج البيانات حيث يجب أن تكون الردود فورية وفي الوقت الحقيقي.

هايكو هو النموذج الأسرع والأكثر كفاءة من حيث التكلفة في السوق لفئته الذكاء. يمكنه قراءة ورقة بحث كثيفة بالمعلومات والبيانات على موقع arXiv (~10k رمز) مع الرسوم البيانية في أقل من ثلاث ثوانٍ. بعد الإطلاق، نتوقع تحسين الأداء بشكل أفضل.

بالنسبة لغالبية الأعباء العملية، يعمل سونيت بسرعة مضاعفة مقارنة بـ Claude 2 و Claude 2.1 مع مستويات أعلى من الذكاء. يتفوق في المهام التي تتطلب استجابات سريعة، مثل استرجاع المعلومات أو التأتيف في المبيعات. يوفر أوبوس سرعات مماثلة لـ Claude 2 و 2.1، ولكن بمستويات ذكاء أعلى بكثير.

قدرات رؤية قوية

تتمتع نماذج Claude 3 بقدرات رؤية معقدة تعادل النماذج الرائدة الأخرى. يمكنها معالجة مجموعة واسعة من الصيغ البصرية، بما في ذلك الصور والرسوم البيانية والرسوم البيانية التقنية. نحن متحمسون بشكل خاص لتوفير هذه الوظيفة الجديدة لعملائنا الشركيين، البعض منهم لديهم ما يصل إلى 50٪ من قواعدهم المعرفية مشفرة بصيغ مختلفة مثل ملفات PDF ومخططات العمل وشرائح العروض التقديمية.

نقص أقل في الرفض

كانت النماذج السابقة لكلود ترفض بشكل غير ضروري مما يوحي بنقص في الفهم السياقي. لقد قمنا بتحقيق تقدم ملموس في هذا المجال: يقل احتمال رفض أوبوس، سونيت، وهايكو بشكل كبير عن رفض الإجابة على الاستفسارات التي تحد من حواجز النظام بالمقارنة مع أجيال النماذج السابقة. كما هو موضح أدناه، تظهر نماذج Claude 3 فهمًا أكثر دقة للطلبات، وتدرك الضرر الحقيقي، وترفض الإجابة على الاستفسارات الغير ضارة بكثافة أقل بكثير.

دقة محسنة

تعتمد الشركات من جميع الأحجام على نماذجنا لخدمة عملائهم، مما يجعل من الضروري أن تحافظ نواتج نماذجنا على دقة عالية على نطاق واسع. لتقييم ذلك، نستخدم مجموعة كبيرة من الأسئلة المعقدة والواقعية التي تستهدف النقاط الضعيفة المعروفة في النماذج الحالية. نصنف الردود إلى إجابات صحيحة، إجابات خاطئة (أو هلاوسيات)، واعترافات بالعدمية، حيث يقول النموذج إنه لا يعرف الإجابة بدلاً من تقديم معلومات خاطئة. بالمقارنة مع Claude 2.1، يظهر أوبوس تحسنًا مضاعفًا في الدقة (أو الإجابات الصحيحة) على هذه الأسئلة الصعبة ذات الطابع المفتوح بينما يظهر أيضًا مستويات منخفضة من الإجابات الخاطئة.

بالإضافة إلى تقديم ردود أكثر موثوقية، سنمكن قريبًا الاستشهادات في نماذجنا Claude 3 حتى تتمكن من الإشارة إلى الجمل الدقيقة في المراجع للتحقق من إجاباتها.

سياق طويل واسترجاع تقريبي مثالي

ستقدم عائلة نماذج Claude 3 نافذة سياقية بحجم 200 ألف عند الإطلاق. ومع ذلك، جميع النماذج الثلاثة قادرة على قبول إدخالات تتجاوز مليون رمز، وقد نجعل هذا متاحًا لعملاء معينين يحتاجون إلى قوة معالجة محسنة.

لمعالجة استفسارات السياق الطويل بشكل فعال، تتطلب النماذج قدرات قوية على الاسترجاع. يُقيّم تقييم “الإبرة في كومة التبن” (NIAH) قدرة النموذج على استرجاع المعلومات بدقة من مجموعة واسعة من البيانات. قمنا بتعزيز قوة هذا المعيار من خلال استخدام إحدى 30 زوج إبرة/سؤال عشوائي لكل استفسار واختباره على مجموعة متنوعة من الوثائق المستخدمة بشكل جماعي. لقد حقق Claude 3 Opus استرجاعًا تقريبيًا مثاليًا، يتجاوز دقة 99%، ولكن في بعض الحالات، حتى تعرف على الحدود الموجودة في التقييم نفسه من خلال التعرف على أن الجملة “الإبرة” تبدو كما لو تم إدراجها اصطناعيًا في النص الأصلي من قبل إنسان.

<img alt=”” class=”wp-image-388″ decoding=”async” height=”506″ loading=”lazy” sizes=”(max-width: 1024px) 100vw, 1024px” src=”https://claude-ai.net/wp-content/uploads/2024/03/2024030611410525-1024×506.png” srcset=”https://claude-ai.net/wp-content/uploads/2024/03/2024030611410525-1024×506.png 1024w, https://claude-ai.net/wp-content/uploads/2024/03/2024030611410525-300×148.png 300w, https://claude-ai.net/wp-content/uploads/2024/03/2024030611410525-768×380.png 768w, https://claude-ai.net/wp-content/uploads/2024/03/202403061141052

التصميم المسؤول

لقد قمنا بتطوير عائلة Claude 3 من النماذج لتكون موثوقة بقدر استطاعتها. لدينا عدة فرق مخصصة تتتبع وتقلل من مجموعة واسعة من المخاطر، تتراوح من نقل المعلومات الخاطئة والمحتوى الإباحي الأطفالي إلى سوء الاستخدام البيولوجي، وتدخل الانتخابات، ومهارات التكاثر الذاتي. نحن مستمرون في تطوير طرق مثل الذكاء الاصطناعي الدستوري التي تحسن سلامة وشفافية نماذجنا، وقمنا بضبط نماذجنا للتخفيف من قضايا الخصوصية التي قد تثار من قبل الوسائط الجديدة.

معالجة التحيزات في النماذج المتطورة بشكل متزايد هي جهد مستمر ولقد حققنا تقدماً مع هذا الإصدار الجديد. كما هو موضح في بطاقة النموذج، يظهر Claude 3 تحيزات أقل من نماذجنا السابقة وفقًا لمؤشر التحيز للإجابة عن الأسئلة (BBQ). نحن ملتزمون بالمضي قدمًا في تطوير تقنيات تقلل من التحيزات وتعزز الحيادية الأكبر في نماذجنا، مضمنين أنها لا تميل نحو أي موقف حزبي بشكل خاص.

بينما قد تقدمت عائلة نماذج Claude 3 في مقاييس رئيسية للمعرفة البيولوجية والمعرفة ذات الصلة بالسيبرانية والحكم الذاتي مقارنة بالنماذج السابقة، إلا أنها تظل عند مستوى سلامة الذكاء الاصطناعي 2 (ASL-2) وفقًا لـ سياسة التوسع المسؤولة لدينا. توصلت تقييمات فرق الاختبار (التي تمت وفقًا لالتزامات البيت الأبيض وأمر التنفيذ الرئاسي الأمريكي لعام 2023) إلى أن النماذج لا تمثل خطرا كارثيا يذكر في الوقت الحالي. سنواصل مراقبة النماذج المستقبلية بعناية لتقييم قربها من عتبة ASL-3. تتوفر مزيد من التفاصيل حول السلامة في بطاقة نموذج Claude 3.

أسهل في الاستخدام

تعمل نماذج Claude 3 بشكل أفضل على اتباع التعليمات المعقدة متعددة الخطوات. إنها ماهرة بشكل خاص في الالتزام بصوت العلامة التجارية وإرشادات الاستجابة، وتطوير تجارب تواجه العملاء يمكن الثقة بها. بالإضافة إلى ذلك، تعمل نماذج Claude 3 بشكل أفضل على إنتاج الإخراج المنظم الشائع بتنسيقات مثل JSON – مما يجعل من الأسهل توجيه Claude لحالات الاستخدام مثل تصنيف اللغة الطبيعية وتحليل المشاعر.

تفاصيل النموذج

Claude 3 Opus هو نموذجنا الأذكى، بأداء يتفوق على الآخرين في المهام المعقدة للغاية. يمكنه التنقل في التعليمات المفتوحة المنتهية والسيناريوهات التي لم يرها من قبل بليونة ملحوظة وفهم شبيه بالإنسان. يظهر لنا Opus الحدود الخارجية لما يمكن تحقيقه باستخدام الذكاء الاصطناعي الإنتاجي.

التكلفة

[التكلفة لكل مليون رمز | الإخراج لكل مليون رمز]

$15 | $75
نافذة السياق 200K*
الاستخدامات المحتملة تلقائي المهمات: التخطيط وتنفيذ الإجراءات المعقدة عبر واجهات برمجة التطبيقات وقواعد البيانات، الترميز التفاعليالبحوث والتطوير: مراجعة البحوث، التفكير التصوري وتكوين الافتراضات، اكتشاف الأدويةالإستراتيجية: تحليل متقدم للرسوم البيانية والخرائط والبيانات المالية واتجاهات السوق، والتنبؤ
الفارق ذكاء أعلى من أي نموذج آخر متاح.

*1M رمز متاحة لحالات الاستخدام المحددة، يرجى الاستفسار.

Claude 3 Sonnet يحقق التوازن المثالي بين الذكاء والسرعة – خاصة بالنسبة لأعباء العمل في المؤسسات. يوفر أداء قوي بتكلفة أقل مقارنة بأقرانه، وهو مصمم للصمود العالي في النشر بمقياس كبير للذكاء الاصطناعي.

التكلفة

[التكلفة لكل مليون رمز | الإخراج لكل مليون رمز]

$3 | $15
نافذة السياق 200K
الاستخدامات المحتملة معالجة البيانات: RAG أو البحث والاسترجاع عبر كميات هائلة من المعرفةالمبيعات: توصيات المنتجات، والتوقعات، والتسويق المستهدفالمهام التي توفر الوقت: إنشاء الرموز، ومراقبة الجودة، وتحليل النصوص من الصور
الفارق أكثر توفرًا من نماذج أخرى بذكاء مماثل؛ أفضل للتوسع.

Claude 3 Haiku هو أسرع نموذج لدينا، وأصغره من حيث الحجم للاستجابة الفورية. يجيب على الاستفسارات والطلبات البسيطة بسرعة لا مثيل لها. سيتمكن المستخدمون من بناء تجارب ذكاء اصطناعي سلسة تحاكي تفاعلات الإنسان.

التكلفة

[التكلفة لكل مليون رمز | الإخراج لكل مليون رمز]

$0.25 | $1.25
نافذة السياق 200K
الاستخدامات المحتملة تفاعلات العملاء: دعم سريع ودقيق في التفاعلات المباشرة، الترجماتالتعديل على المحتوى: اكتشاف السلوك الخطر أو طلبات العملاءالمهام التي توفر التكلفة: اللوجستيات المحسنة، وإدارة المخزون، واستخراج المعرفة من البيانات غير المهيكلة
الفارق أذكى وأسرع وأكثر توفرا من النماذج الأخرى في فئتها من الذكاء.

توافر النموذج

يمكن استخدام Opus و Sonnet اليوم في واجهة برمجة التطبيقات لدينا، التي أصبحت متاحة عمومًا الآن، مما يتيح للمطورين التسجيل وبدء استخدام هذه النماذج على الفور. سيكون Haiku متاحًا قريبًا. يعمل Sonnet أيضًا اليوم من خلال Amazon Bedrock وفي المعاينة الخاصة على Google Cloud’s Vertex AI Model Garden – مع Opus و Haiku القادمة قريبًا على الاثنين.

أذكى وأسرع وأكثر أمانًا

نحن لا نعتقد أن ذكاء النموذج وصل إلى حدوده بأي حال من الأحوال، ونعتزم إصدار تحديثات متكررة لعائلة نماذج Claude 3 خلال الأشهر القادمة. نحن أيضًا متحمسون لإطلاق سلسلة من الميزات لتعزيز قدرات نماذجنا، خاصة لحالات الاستخدام في المؤسسات والنشر بمقياس كبير. ستشمل هذه الميزات الجديدة استخدام الأدوات (التي تعرف أيضًا باسم الدعوة للوظائف)، الترميز التفاعلي (الذي يعرف أيضًا باسم REPL)، وقدرات وكالية متقدمة أكثر.

بينما ندفع بحدود قدرات الذكاء الاصطناعي، نحن ملتزمون على قدم المساواة بضمانات السلامة الخاصة بنا تتماشى مع هذه القفزات في الأداء. فرضيتنا هي أن تكون على الحافة الأمامية لتطوير الذكاء الاصطناعي هي الطريقة الأكثر فعالية لتوجيه مساره نحو نتائج اجتماعية إيجابية.

نحن متحمسون لمشاهدة ما ستبتكره مع Claude 3 ونأمل أن تقدم لنا تعليقات لجعل Claude مساعدًا وشريكًا إبداعيًا أكثر فائدة. لبدء البناء مع Claude، قم بزيارة anthropic.com/claude.

هامشيات

  1. تظهر هذه الجدول مقارنات بالنماذج المتاحة تجاريًا حاليًا التي قد أصدرت تقييمات. تظهر بطاقة النموذج لدينا مقارنات بنماذج تم الإع

    تمت ترجمة محتوى هذه المقالة من المقال الأصلي

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *