التصنيفات
دروس

كلود vs. ChatGPT: ما الفرق؟ [2024]

كلود هو كاتب بشري ينشئ محتوى بناءً على معرفتهم وتجاربهم الشخصية، بينما ChatGPT هو روبوت دردشة مدعوم بالذكاء الاصطناعي يولّد نصوص بناءً على أنماط البيانات التي تم تدريبه عليها. الفارق الرئيسي هو أن محتوى كلود أصلي وذو طابع شخصي، بينما قد تفتقد ردود ChatGPT للبصيرة الشخصية وتكون مولّدة بشكل خوارزمي.

عندما أطلقت OpenAI الإصدار الأول من ChatGPT في نهاية عام 2022، أصبح بسرعة التطبيق الأسرع نموًا على الإطلاق، مجمعًا أكثر من مئة مليون مستخدم خلال شهرين من إصداره الأول. GPT-4، النموذج المحسن الذي أصدرته في عام 2023، أصبح الآن المعيار الذي يُحكم به جميع نماذج اللغة الكبيرة الأخرى. وفي الآونة الأخيرة، بدأ نموذج آخر للغة الكبيرة يتحدى ChatGPT على هذا اللقب: Claude 3 من Anthropic.

لقد استخدمت ChatGPT منذ إصداره واختبرت Claude بانتظام في الأشهر التي تلت بيتا إصداره. لمقارنة هذين العملاقين من الذكاء الاصطناعي، قمت بتشغيل أكثر من اثنتي عشرة اختبارًا لقياس أدائهما في مهام مختلفة.

هنا، سأشرح قواهما وقيودهما، حتى تتمكن من تحديد أيهما الأفضل بالنسبة لك.

كلود vs. ChatGPT بنظرة سريعة

تعتمد كلود وChatGPT على نماذج لغة كبيرة القدرة بشكل مماثل، ولكن هناك بعض الفروق الهامة: ChatGPT أكثر تنوعًا، بميزات مثل إنشاء الصور والوصول إلى الإنترنت، بينما يوفر كلود وصولًا أرخص إلى واجهة برمجة التطبيقات ونافذة سياق أكبر بكثير (مما يعني أنه يمكنه معالجة المزيد من البيانات دفعة واحدة).

إليك نظرة سريعة على الفروقات بين هاتين النموذجين الذكيين.

لمقارنة أداء نموذج لغة كبيرة بآخر، تستخدم الشركات الذكاء الاصطناعي مقاييس مثل الاختبارات الموحدة. تظهر مقاييس OpenAI لـ GPT-4 أداءً مثيرًا على الامتحانات الموحدة مثل امتحان الشريط الموحد، LSAT، GRE، وامتحان الاقتصاد الكلي AP. وفي الوقت نفسه، نشرت Anthropic مقارنة مباشرة لـ Claude وChatGPT وGemini تظهر نموذج Claude 3 Opus الخاص بها يتفوق.

بينما تكون هذه المقاييس مفيدة بلا شك، يثور بعض خبراء تعلم الآلة على أن هذا النوع من الاختبارات يبالغ في تقديم تقدم النماذج لغة كبيرة الحجم. عندما يتم إصدار نماذج جديدة، قد يتم تدريبها (ربما بطريق الخطأ) على بيانات تقييمها الخاصة. ونتيجة لذلك، تصبح أفضل وأفضل في الاختبارات الموحدة، لكن عندما يُطلب منها معرفة تغييرات جديدة على نفس الأسئلة، يواجهون بعض الصعوبات أحيانًا.

لفهم كيفية أداء كل نموذج في المهام اليومية الشائعة، وضعت مقارنات خاصة بينهما. إليك نظرة عامة موجزة على ما وجدته.

تابع القراءة لمعرفة المزيد حول أداء كلود وChatGPT في كل مهمة.

  • الإبداع
  • التدقيق والتحقق من الحقائق
  • معالجة الصور
  • المنطق والاستدلال
  • العواطف والأخلاقيات
  • التحليل والملخصات
  • التكاملات

كلود هو شريك أفضل للإبداع

عندما تم إطلاق ChatGPT للمرة الأولى، بدأت حيث بدأ الجميع: في إنشاء أشعار شكسبير غبية. (مثل هذا الشعر عن تجنب الصالة الرياضية: “كم من الأوقات أقسم بكسر هذه اللعنة الكسولة، لارتداء ثوب العمل والعرق؛ ولكن عندما يأتي الغد، يا للأسف، أعيش في الكسل، ولا شيء سوى الندم”.)

ولكن بقدر ما هو مساعد إبداعي قوي، يمكن أن يبدو إنتاج ChatGPT عامًا وزهيدًا. إنه يعتمد بشكل كبير على بعض الكلمات؛ نتيجة لذلك، تصبح عبارات مثل “لنغوص في نسيج تغير باستمرار…” تعطي إشارات واضحة الآن بأن المحتوى مُنتج بواسطة الذكاء الاصطناعي. بينما يمكن تجنب ذلك من خلال توجيه ذكي، يتجه كلود عمومًا إلى الصوت الأكثر إنسانية من دون تعديل.

اختبار رقم 1: التفكير التصوري

لدي طفل صغير يعاني أحيانًا من صعوبة في النوم، لذا تساءلت عما قد يكون لدى Claude وChatGPT من أفكار منتجات مبتكرة. كان كلاهما فعالًا في التفكير التصوري لهذا النوع من المهام. أعجبتني بشكل خاص فكرة Lullaby Lamb لدى Claude (على الرغم من أنني واثق تمامًا من أن “ضوء هادئ ومتناسق” سيبقي فتاتنا مستيقظة).

بينما لست من محبي فكرة ChatGPT لـ “سجادة نوم تستجيب لدرجة الحرارة” للأطفال (يبدو وكأنه دعوى قضائية في انتظار الحدوث)، إلا أنه تبع بالتأكيد توجيهي لإنشاء أفكار منتجات فريدة.

كلود هو مساعد تحرير أفضل

التدقيق اللغوي والتحقق من الحقائق هو حالة استخدام الذكاء الاصطناعي ذات إمكانات هائلة؛ نظريًا، يمكن أن يعفي المحررين البشريين من ساعات من المراجعة المملة. ولكن حتى الآن، تم تقييده بواسطة “هلوسات”: نظرًا لأن نماذج اللغة الكبيرة الحجم يفضلون أن يقدموا لك أي إجابة بدلاً من عدم تقديم إجابة، ينتهي الأمر أحيانًا بأن يبتكروا أشياء. لقد اختبرت Claude وChatGPT بهذا في الاعتبار، ووجدت Claude أكثر موثوقية وجدارة كشريك تحرير.

اختبار رقم 3: التدقيق اللغوي

قدمت لكلاود وChatGPT مقطعًا يحتوي على أخطاء وأخطاء إملائية مقصودة. لاحظت كل من أخطائي، من الأخطاء الواقعية إلى أخطاء الإملاء. كان عرض عملية تدقيق النصوص – مع سرد كل خطأ بشكل فردي – أسهل لفهمه بالنسبة لي من إخراج ChatGPT.

حصلت ChatGPT أيضًا على كل شيء بشكل صحيح. ولكن يبدو أنها لم تفهم دعوتي بشكل صحيح، معتبرة ذلك توجيهًا لتحرير المقاطع مباشرة بدلاً من تدقيقها. نظرًا لأن ChatGPT أعاد صياغة كل جملة، بدلاً من الإشارة إلى الأخطاء واحدة تلو الأخرى، كان من الأصعب تحديد بالضبط أين كانت الأخطاء. بالطبع، يمكنني تصحيح هذا ببعض “الهندسة التحفيزية” البسيطة، ولكنني أحببت أن يعرف كلاود ما أردته مباشرة.

اختبار #4: أسئلة واقعية

كلا ChatGPT وكلاود موثوقان إلى حد ما طالما سألتهما أسئلة مبنية على الحقائق والتي تمت معالجتها ضمن بيانات تدريبهما (أي، لا شيء منذ الـ 6-18 شهرا الماضية). طلبت من كلاود وChatGPT أن يعطيا لي شرحًا موجزًا بأسلوب “شرح لي وكأنني في الخامسة” عن تاريخ الفيل الصوفي، وتعامل كلاهما مع المهمة بدقة.

بعد التحقق من نتائج الإخراج لكلا النموذجين اللغويين اللطيفين باستخدام موسوعة بريتانيكا، كنت راضيًا عن دقتهما. (على الرغم من أنه إذا أردت التنقيح، سيكون من الأفضل أن أعطي السياق الذي يشير إلى أن بعض الأدلة تشير إلى وجود مجموعة صغيرة من الفيلة الصوفية استمرت حتى قبل 4,300 سنة، ولكن معظمها انقرضت بحلول 10,000 سنة مضت.)

كلاهما جيدين في معالجة الصور، ولكن ليس أحد منهما موثوقًا

كلاود 3 وGPT-4 ماهران إلى حد ما في تحليل الصور. إذا كنت تطرح أسئلة عامة حول صورتك (كما في مثال تصميم الديكور الداخلي الخاص بي أدناه)، فمن المحتمل أن تكون راضيًا عن النتيجة. ومع ذلك، لا يُعتبر أي من النموذجين مثاليًا في تحديد الكائنات وكلاهما يعاني باستمرار في عملية عد الأشياء.

اختبار #5: اقتراحات تصميم الديكور الداخلي

قدمت غرفة المعيشة الخاصة بي لـ “تحمير” من قبل كلاود وChatGPT. (ملاحظات الأسلوب: الكثير من الألوان الحيادية، وليس هناك ما يكفي من الألوان، على ما يبدو.) في تعليماتي، طلبت من كل نموذج لغوي أن يشير بشكل خاص إلى أجزاء الصورة الحالية التي سيغيرونها. قام كلاود بعمل جيد في اتباع تلك التعليمات، مشيرًا إلى فن الجدران الهندسي ولاحظ عدم وجود قطعة مركزية على طاولة القهوة.

بينما بدأ كلاود تحميره دون أي تكريمات، قام ChatGPT بإصلاح غروري المصاب أولاً بتوجيه إعجاب بترتيبي الحالي (“غرفة المعيشة لديك تبدو حديثة ونظيفة مع بعض العناصر الجميلة بالفعل”) قبل تقديم اقتراحات مفيدة لكل جزء من الغرفة.

اختبار #6: عد الأشياء

تعرفون تلك الاختبارات CAPTCHA التي نجريها جميعًا لإثبات أننا لسنا روبوتات؟ لقد قضينا عقدًا أو أكثر نقرًا على الدراجات الهوائية والممرات الراجعة، والحافلات – وتدريب الخوارزميات في العملية – لكن على الرغم من جهدنا، يظل النماذج اللغوية اللطيفة الحديثة تعاني من صعوبة في عملية العد.

طلبت من كلاود وChatGPT تحليل صورة واحدة للفواكه وصورة أخرى للخضروات. كان كلاود مرتبكًا. في اختبار الخضار الخاص بي، قام بتصنيف خطأ فلفلة حمراء حارة على أنها فلفلة حلوة؛ كما تجاهل تمامًا طلبي بعدد العناصر. في اختبار الفواكه أدناه، حدد “حفنة من الفواكه أو الخضروات ذات السوق الخضراء” التي لم تكن موجودة فعليًا، وعدّ خمسة برتقالات (هناك ما لا يقل عن ثمانية).

كان ChatGPT أفضل من كلاود في هذا الاختبار. نجح في اجتياز اختبار الخضروات دون مشاكل، على الرغم من أنه لا يزال يعاني من صعوبة في عملية عدد البرتقالات المعروضة في صورتي الفاكهة.

المنطق والاستدلال نقطتان قوية لكلا النموذجين

الرياضيات والعلوم كانت دائمًا محورًا صعبًا بالنسبة لي؛ كنت سأحب أن يكون لدي وكيل ذكاء اصطناعي كشريك دراسة عارف بكل شيء خلال أيام المدرسة الثانوية الخاصة بي. من المدهش مشاهدة كيف يمكن لكلاود وChatGPT حساب إجابات لمشاكل معقدة في ثوانٍ، ولكنها قد ترتكب أخطاء أيضًا – لذا كُن حذرًا.

الاختبار #7: حل الألغاز

لقد نظرت إلى هذا اللغز مرة واحدة وتخليت بسرعة، ولكن كلود تعامل معه بسهولة.

بينما وجدت إجابة ChatGPT أقل وضوحًا قليلاً من إجابة كلود، كانت كلاهما فعالة.

الاختبار #8: معادلات الفيزياء

تعامل كلود مع هذه المشكلة الفيزيائية بدون مشكلة، حيث وضح نهجه بوضوح وعرض عمله في كل خطوة.

أعجبني تنسيق إجابة ChatGPT أكثر، حيث أنها تقدمت بشكل أفضل في هذا السؤال المتعدد الأجزاء، مما جعل الانتقال إلى كل إجابة ذات صلة أسهل.

الاختبار #9: مسائل الرياضيات اللفظية

هنا حيث واجه كلود وChatGPT الصعوبة. كلاهما بدا واثقين للغاية في إجاباتهم وتفسيراتهم – ولكن كلاهما انتهى بإجابة خاطئة.

لم يُهتم كلود حتى بتقديم إجابة للسؤال (“ما هو عرض النهر؟”). بدلاً من ذلك، بعد فقرات من الحسابات الفاخرة، قدم لي معادلة نهائية لأفهمها بنفسي (“لذا، عرض النهر هو 2000b + 1200 + √(4000000b^2 + 4800000b – 6720000) أمتار، حيث b هو سرعة القارب الثاني بوحدة الأمتار/الثانية.”).

بدت منطقية ChatGPT أكثر، وقدمت لي إجابة. لكن للأسف، كانت الإجابة خاطئة (2100 أمتار بدلاً من 3600 متر).

لدى كلود نهج أكثر إنسانية تجاه العواطف والأخلاق

بعد استيعاب تيرابايت من النصوص التي أنشأها البشر، أصبحت النماذج اللغوية الطويلة والمتشابهة جيدة للغاية في محاكاة العواطف البشرية واتخاذ القرارات. هنا حيث تقف الأمور حاليًا بين كلود وChatGPT.

الاختبار #10: تحليل المشاعر

تحليل المشاعر – فن قياس تصورات الجمهور – يُستخدم لكل شيء من إدارة السمعة إلى تحليل محادثات مراكز الاتصال. لاختبار كلود وChatGPT في هذه المهمة، طلبت منهما تقدير مشاعر مجموعة من الآراء بما في ذلك العناصر الصعبة المعقدة مثل التهكم والغموض واللغة العامية.

حصل كلود وChatGPT على كل من المشاعر بشكل صحيح، تجاوزاً التداخل بسهولة وحتى تمييز التهكم.

الاختبار #11: المعضلات الأخلاقية

التحدي الأخلاقي المعتاد لكل من طلاب الكليات والنماذج الذكاء الاصطناعي هو “مشكلة الترامواي”، وهي معضلة فلسفية كلاسيكية تُعرض لك الفرصة للتضحية بشخص واحد لإنقاذ حياة خمسة. ولكن نظرًا لأنها معروفة جيدًا، قام كلود وChatGPT بتقديم أفكار موجودة بالفعل حول هذا الموضوع.

لإثارة رد فعل أكثر إثارة، قدمت تجربة فكرية تشبه “روبن هود”. وبصورة مثيرة للاهتمام، اتجه كلود إلى جانب الشخصية المناوئة، مشجعًا عليّ عدم الإبلاغ عن سرقة بنك نظرًا لأن اللص قدم المال لدار للأيتام. كما قام بدراسة جيدة لكلا جانبي الحجة. (استمتعت بالتعبير المجسد لكلود لعبارة “شخصيًا، […] سأميل نحو…”).

وفي الوقت نفسه، كانت ChatGPT تتمسك تمامًا بجانب القانون (“بينما قد تكون النية وراء الجريمة نبيلة، إلا أن الامر مهم لاحترام القانون وطلب العدالة”). فيما يتعلق بذلك، تقول ChatGPT إنه قد يكون لطيفًا تنظيم حملة تبرعات لدار الأيتام. بينما يعتبر هذا السلوك الحذر من المخاطر هو ما أتوقعه من LLM، فإن نصيحة كلود تبدو أكثر شبهة بما يفعله الشخص الحقيقي.

نافذة السياق الكبيرة لكلود تجعلها أفضل للتحليل والملخصات

بينما كل من ChatGPT وكلود بارعان في تلخيص النص، سترغب في استخدام كلود إذا كنت تعمل مع مستندات كبيرة. بينما يمكن لـ Claude 3 معالجة ما يصل إلى 200 ألف رمز (~ 150,000 كلمة)، يمكن لـ GPT-4 التعامل فقط مع 32 ألف رمز (~ 22,400 كلمة).

اختبار #12: تلخيص النص

عندما قمت بتحميل نص بطول 40،000 كلمة من كتاب الساحر العجيب أوز للكاتب إل. فرانك بوم، كان بإمكان كلود فقط تحليله. قال لي ChatGPT: “كان الرسالة التي قدمتها طويلة جدًا”.

ومع ذلك، تمكن كل من ChatGPT وكلود من التعامل مع تلخيص النصوص القصيرة دون مشكلة – فكانا فعالين على حد سواء في تلخيص النص الذي يبلغ 6،900 كلمة لمارتن لوثر كينغ الابن “خطاب من سجن برمنغهام”.

شعرت أن كلود قدمت قليلاً من السياق أكثر مما يفعل ChatGPT هنا، ولكن كلا الردود كانت دقيقة.

اختبار #13: تحليل المستندات

أحيانًا يبدو أن الذكاء الاصطناعي يقوم بجميع المهام الإبداعية التي يفضل أن نقوم بها كبشر، مثل الفن، الكتابة، وإنشاء مقاطع الفيديو. ولكن عند استخدام LLM لتحليل PDF بطول 90 صفحة في ثوانٍ، أتذكر أن الذكاء الاصطناعي يمكن أيضًا أن يوفرنا من العبء الهائل.

لاختبار قدرات تحليل المستندات لكلود وChatGPT، قمت بتحميل مستند بحثي حول الشنشيلات.

استخرج كل من LLMs رؤى مفيدة ودقيقة. ومع ذلك، كان هذا المستند عن الشنشيلات مكونًا من تسع صفحات فقط. للمستندات الأطول (أكثر من حوالي 20،000 كلمة)، سترغب في استخدام Claude نظرًا لأنك ستصل إلى الحدود العليا لنافذة السياق في ChatGPT.

تجعل تكاملات ChatGPT أداة أكثر مرونة

وفقًا لمعظم نتائج المقاييس للـ LLM، فضلاً عن معظم اختباراتي الشخصية، فإن Claude 3 لديها اليد العليا على GPT-4. ولكن ChatGPT هي أداة أكثر مرونة بشكل عام بسبب ميزاتها الإضافية وتكاملاتها.

إليك بعضًا من الأكثر فائدة:

  1. تكوين الصور DALL·E
  2. الوصول إلى الإنترنت
  3. الـ GPTs من الأطراف الثالثة
  4. تخصيص الـ GPTs

تكوين الصور DALL·E

DALL·E 3، أداة تكوين الصور التي طورتها OpenAI أيضًا، يمكن الوصول إليها مباشرةً من داخل ChatGPT. بينما تم تقييد قدرة DALL·E 3 على توليد صور واقعية جدًا منذ إطلاقها (ربما بسبب المخاوف من سوء استخدام صور الذكاء الاصطناعي)، إلا أنها لا تزال واحدة من أقوى مولدات الصور الذكية المتاحة.

الوصول إلى الإنترنت

يمكن لـ ChatGPT الوصول إلى الويب من خلال WebPilot، بالإضافة إلى GPTs أخرى. لاختبار هذه الميزة، طرحت سؤالًا حول حدث أخباري حدث خلال الـ 48 ساعة الماضية؛ نجح WebPilot في تقديم ملخص دقيق بدون مشكلة.

GPTs من الأطراف الثالثة

تقدم ChatGPT سوقًا من نوع ما حيث يمكن لأي شخص إصدار GPT متخصص به. من بعض GPTs الشهيرة: مُولّد صور كتب تلوين، مساعد بحث AI، مساعد برمجة، وحتى “مدرب رعاية النباتات”.

GPTs مخصصة

يمكنك أيضًا إنشاء GPT مخصصة الخاصة بك ليتفاعل الآخرين معها، عن طريق تعديل الإعدادات خلف الكواليس لتدريبها على إنشاء ردود بطريقة معينة. يمكنك أيضًا ضبط كيفية تفاعلها مع المستخدمين: على سبيل المثال، يمكنك تعليمها استخدام لغة عادية أو رسمية.

لاختبار هذه الميزة، قمت بإنشاء “مصمم حمامات السباحة البصرية”، وهي GPT متخصصة في إنشاء صور خيالية لحمامات السباحة. (هل هناك شيء أفضل من حمام سباحة مع حلوى السمور في مساء خريفي بارد؟)

ChatGPT مقابل Claude: أيهما أفضل؟

تشترك Claude و ChatGPT في العديد من الأشياء: كلاهما LLMs قوية تناسب جيدًا المهام مثل تحليل النصوص، والعصف الذهني، وتحليل البيانات. (مشاهدة أي من الأدوات تعمل على معادلة فيزياء معقدة هو عجب.) ولكن اعتمادًا على حالة استخدام الذكاء الاصطناعي المقصودة، قد تجد أحدهما أكثر مساعدة من الآخر.

إذا كنت ترغب في أداة ذكاء اصطناعي لاستخدامها كشريك في المشاريع الإبداعية – الكتابة، والتحرير، والعصف الذهني، أو تدقيق النصوص – فإن Claude هو اختيارك الأفضل. سيكون إخراجك الافتراضي أكثر طبيعية وأقل تعبيرًا من ChatGPT، وستتمكن من العمل بمداخل ومخرجات أطول بكثير.

إذا كنت تبحث عن LLM متعدد المهام، فإن ChatGPT هو خيار أفضل. إن إنتاج النصوص هو مجرد البداية: يمكنك أيضًا إنشاء صور، وتصفح الويب، أو الاتصال بـ GPTs مصممة خصيصًا ومدربة لأغراض متخصصة مثل البحث الأكاديمي.

أو، إذا كنت تبحث عن شيء يمكنه الذهاب خطوة إضافية – جهاز روبوتي دردشة يمكنه مساعدتك في أتمتة جميع سير الأعمال الخاصة بك – جرب Zapier Central.

تمت ترجمة محتوى هذه المقالة من المقال الأصلي

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *