This article is displayed in its original language.
Electronics

ChatGPT مقابل Gemini: اختبارات العالم الحقيقي تكشف عن نتائج مذهلة

أجرى تحقيق DailyWiz وضع ChatGPT Plus في مواجهة Gemini Advanced في سبعة اختبارات واقعية، مما كشف عن تحولات مفاجئة في الأداء وافتراضات تفوق الذكاء الاصطناعي الصعبة.

DailyWiz Editorial··4 min read·378 views
ChatGPT مقابل Gemini: اختبارات العالم الحقيقي تكشف عن نتائج مذهلة

مواجهة الذكاء الاصطناعي: عصر جديد من الذكاء

يتطور مشهد الذكاء الاصطناعي بوتيرة غير مسبوقة، حيث أصبحت النماذج اللغوية الكبيرة (LLMs) أدوات لا غنى عنها للملايين في جميع أنحاء العالم. في طليعة هذه الثورة يوجد ChatGPT من OpenAI وGemini من Google، وهما عملاقان يخوضان معركة شرسة من أجل التفوق. في حين أن التصورات الأولية غالبًا ما تفضل ChatGPT نظرًا لدخوله المبكر إلى السوق واعتماده على نطاق واسع، فقد كشفت سلسلة حديثة من سبعة اختبارات واقعية أجراها فريقنا الفني في DailyWiz عن تحول رائع وغير متوقع في كثير من الأحيان في ديناميكيات الأداء.

على مدى أشهر، ناقش مجتمع التكنولوجيا الذكاء الاصطناعي الذي يوفر إمكانات فائقة، خاصة مع قيام Google بدفع منصة Gemini الخاصة بها، التي تم إطلاقها في ديسمبر 2023، كمنافس مباشر لـ ChatGPT التي أنشأتها OpenAI، والتي ظهرت لأول مرة في نوفمبر 2022. ويهدف تقييمنا الشامل إلى لتجاوز المعايير النظرية، ووضع الإصدارات المتميزة — ChatGPT Plus (يضم GPT-4o) وGemini Advanced (المدعوم من Gemini Ultra 1.5) — في مواجهة بعضهما البعض في سيناريوهات عملية تعكس الاستخدام المهني والشخصي اليومي. كانت النتائج، كما أشارت الدكتورة إيفلين ريد، كبيرة محللي التكنولوجيا في DailyWiz، مفاجئة حقًا، حيث تتحدى العديد من المفاهيم المسبقة حول مساعدي الذكاء الاصطناعي الأقوياء.

تحدي العالم الحقيقي: معلمات الاختبار

تضمنت منهجيتنا إخضاع كلا نموذجي الذكاء الاصطناعي لتحدي صارم من سبع مهام متميزة مصممة لتقييم الإبداع، والتفكير المنطقي، وكفاءة البرمجة، وتلخيص البيانات، والدقة الرياضية، وترجمة اللغة، فهم متعدد الوسائط. تم تسجيل كل اختبار على أساس السرعة والدقة والتماسك والمنفعة الشاملة. على سبيل المثال، في اختبار الكتابة الإبداعية، طُلب من كلا الذكاءين الاصطناعيين صياغة مقال مدونة مكون من 500 كلمة حول الزراعة الحضرية المستدامة. يتضمن تحدي الترميز تصحيح أخطاء نص Python وإنشاء وظيفة جديدة لمنصة بسيطة للتجارة الإلكترونية. من أجل تلخيص البيانات، كان عليهم استخلاص رؤى أساسية من ملخص علمي مكون من 1500 كلمة حول الحوسبة الكمومية.

وشملت الاختبارات الأخرى حل المعادلات الجبرية المعقدة، وترجمة مستند تقني من الإنجليزية إلى اليابانية، وتفسير البيانات المرئية من مخطط (اختبار متعدد الوسائط لـ Gemini، مع مكافئ نصي لـ ChatGPT)، وإنشاء مسارات سفر مخصصة بناءً على قيود محددة على الميزانية والفوائد. تم تصميم كل سيناريو لدفع حدود القدرات الخاصة به، وتوفير نظرة تفصيلية على نقاط القوة والضعف لديهم في التطبيق العملي.

تفكيك ما هو غير متوقع: رؤى الأداء

في حين حافظ ChatGPT Plus، بنموذجه GPT-4o، على ريادته المتوقعة في الكتابة الإبداعية وطلاقة المحادثة العامة، مما أدى إلى إنتاج نثر أكثر جاذبية وشبيهًا بالإنسان في متوسط ​​45 ثانية، تفوق Gemini Advanced بشكل غير متوقع في المجالات التي كان يعتبر فيها ChatGPT تقليديًا قويًا. في تحدي البرمجة، أظهر Gemini Ultra 1.5 قدرات فائقة في تصحيح الأخطاء، حيث حدد واقترح إصلاحات لبرنامج Python النصي الخاص بنا بشكل أسرع بنسبة 15% من GPT-4o وأنتج المزيد من مقتطفات التعليمات البرمجية المحسنة. علق الدكتور ريد، "كان فهم جيميني للهياكل المنطقية وبناء الجملة دقيقًا بشكل ملحوظ، وغالبًا ما يقدم حلولاً أكثر أناقة من شأنها أن توفر للمطور وقتًا كبيرًا."

جاءت مفاجأة كبيرة أخرى في اختبار الدقة الرياضية. على الرغم من أن كلا النموذجين كان أداؤهما جيدًا في المشكلات القياسية، إلا أن Gemini Advanced تفوق باستمرار على ChatGPT Plus في المعادلات الجبرية المعقدة ومتعددة الخطوات، مما أظهر عددًا أقل من الأخطاء وعملية تفكير أكثر وضوحًا خطوة بخطوة. ومع ذلك، استعاد ChatGPT مكانته في اختبار ترجمة اللغة، حيث قدم ترجمات أكثر دقة وملاءمة ثقافيًا للوثيقة الفنية، خاصة في التعبيرات الاصطلاحية، مقارنة بمخرجات Gemini الأكثر حرفية. الاختبار متعدد الوسائط، حيث يستطيع Gemini تفسير صورة مخطط المبيعات مباشرة، أعطاه ميزة متأصلة، مما يسمح بتحليل أسرع وأكثر مباشرة من إدخال النص فقط في ChatGPT.

التسعير وإمكانية الوصول والتوصيات

يأتي الوصول إلى نماذج الذكاء الاصطناعي المتطورة هذه مع خيارات متنوعة. بالنسبة للمستخدمين والطلاب العاديين، يقدم كل من OpenAI وGoogle مستويات مجانية قوية. يتوفر الإصدار الأساسي من ChatGPT (المدعوم بواسطة GPT-3.5) مباشرة عبر موقع OpenAI وتطبيقات الهاتف المحمول الخاصة به. يمكن الوصول إلى نموذج Gemini Pro من Google مجانًا من خلال gemini.google.com ويتكامل مع بعض تطبيقات Google Workspace.

بالنسبة لأولئك الذين يحتاجون إلى إمكانات متقدمة، فإن الاشتراكات المتميزة هي حيث تكمن القوة الحقيقية. تبلغ تكلفة ChatGPT Plus 20 دولارًا شهريًا، مما يتيح الوصول إلى نموذج GPT-4o الأكثر قوة، وحدود استخدام أعلى، وأوقات استجابة أسرع. وبالمثل، يبلغ سعر Gemini Advanced 19.99 دولارًا أمريكيًا شهريًا (غالبًا مع نسخة تجريبية مجانية ترويجية)، مما يمنح المستخدمين إمكانية الوصول إلى طراز Gemini Ultra 1.5 ذو القدرة العالية. عادةً ما تتم إدارة الاشتراكات مباشرة من خلال الأنظمة الأساسية الخاصة بها.

توصياتنا: بالنسبة للمحترفين المبدعين ومنشئي المحتوى وأولئك الذين يعطون الأولوية للمحادثات الدقيقة والنثر الجذاب، يظل ChatGPT Plus منافسًا قويًا. لا تزال قدرتها على توليد روايات مقنعة والتكيف مع أساليب الكتابة المختلفة معيارًا قياسيًا. ومع ذلك، بالنسبة لمطوري البرامج وعلماء البيانات والمستخدمين الذين يحتاجون إلى تفكير منطقي قوي ومساعدة دقيقة في الترميز وحل المشكلات الرياضية القوية، برز برنامج Gemini Advanced كخيار قوي بشكل مدهش ومتفوق في كثير من الأحيان. يشير أدائها في هذه المجالات التقنية إلى استثمار Google الكبير في جعل Gemini أداة مفضلة للمهام التحليلية. في النهاية، يعتمد الذكاء الاصطناعي "الأفضل" على سير العمل الفردي ومتطلبات المهام المحددة، مما يجعل كلتا الأداتين لا غنى عنهما في مجموعة الأدوات الرقمية اليوم.

Recommended

* We may earn a commission from qualifying purchases at no extra cost to you.

Comments

No comments yet. Be the first!

Related Posts

تم منع مشغل KuCoin من السوق الأمريكية من قبل هيئة تداول السلع الآجلة (CFTC) وسط حملة القمع

تم منع مشغل KuCoin من السوق الأمريكية من قبل هيئة تداول السلع الآجلة (CFTC) وسط حملة القمع

لم يعد بإمكان Peken Global Limited، مشغل بورصة العملات المشفرة العالمية KuCoin، خدمة المستخدمين الأمريكيين دون التسجيل كمجلس تجارة أجنبي، وذلك بعد أمر لجنة تداول السلع الآجلة (CFTC) وإجراء إنفاذ سابق بقيمة 297 مليون دولار من وزارة العدل.

تشير مبيعات سندات الخزانة الأمريكية في الشرق الأوسط إلى التحول نحو النمو المحلي

تشير مبيعات سندات الخزانة الأمريكية في الشرق الأوسط إلى التحول نحو النمو المحلي

يقوم كبار منتجي النفط في الشرق الأوسط بتصفية ديون الحكومة الأمريكية، مدفوعة بالحاجة المتزايدة إلى السيولة لتمويل مشاريع التنويع الاقتصادي المحلية الطموحة.

Kid Rock's Helicopter Salute Sparks US Army Investigation

Kid Rock's Helicopter Salute Sparks US Army Investigation

Country rock artist Kid Rock sparked a US Army probe after posting footage of a military helicopter flyby at his mansion, raising questions about unauthorized use of military assets.

يقدم اختراق واترلو تفسيرًا جديدًا للانفجار الكبير

يقدم اختراق واترلو تفسيرًا جديدًا للانفجار الكبير

يقترح العلماء في جامعة واترلو نظرية الانفجار الكبير الثورية، مما يشير إلى أن النمو الانفجاري المبكر للكون ينشأ بشكل طبيعي من الجاذبية الكمية.

اعتماد الذكاء الاصطناعي يرتفع، لكن الثقة تتراجع بين الأميركيين

اعتماد الذكاء الاصطناعي يرتفع، لكن الثقة تتراجع بين الأميركيين

على الرغم من التبني المتزايد لأدوات الذكاء الاصطناعي في الولايات المتحدة، يكشف استطلاع أجرته جامعة كوينيبياك عن تراجع الثقة، مدفوعًا بالمخاوف بشأن الشفافية والتنظيم والتأثير المجتمعي. تستكشف هذه المقالة المفارقة وتقدم نصائح عملية للمستخدمين.

رهان Sysco بقيمة 29.1 مليار دولار على المستثمرين النقديين والحمليين

رهان Sysco بقيمة 29.1 مليار دولار على المستثمرين النقديين والحمليين

تراجعت أسهم Sysco بعد الإعلان عن صفقة نقدية وأسهم بقيمة 29.1 مليار دولار للاستحواذ على Jetro Restaurant Depot، مما يشير إلى تحول استراتيجي كبير في أعمال الخدمات الغذائية "النقدية والحملية".