“جيميني” المتعدد الوسائط أنموذج جديد للذكاء الاصطناعي
أعلنت “غوغل”، مؤخراً، عن نموذج للذكاء الاصطناعي يُعرف باسم “جيميني”، وقدّمته على أنه أنموذجها الأكبر والأكثر قدرة في الذكاء الاصطناعي، وأعلنت عن “عصر جيميني” الذي يتوقع استخدام هذا النموذج العملاق في التكنولوجيا في كل بيئة، من أجهزة الشركات الكبيرة إلى المستهلكين.
وقالت “غوغل” إنه على عكس نماذج الذكاء الاصطناعي الحالية التي تتعامل عادةً مع نوع واحد فقط من أوامر المستخدم، مثل الصور أو النصوص حصرياً، فقد صمم “جيميني” ليكون “متعدد الوسائط”، وهذا يعني أنه يقبل المدخلات التي تتضمن أنواعاً متعددة من الوسائط، وتجمع بين النصوص والصور والصوت والفيديو ورموز البرمجة.
وقالت الشركة، الأربعاء، إنه تم ترقية برنامج الدردشة الآلي “بارد” المملوك لشركة “غوغل” فعلياً بنسخة من نموذج “جيميني”، مع خطط لإضافة “جيميني” إلى المنتجات المستخدمة على نطاق واسع بما في ذلك محرك بحث “غوغل” ومتصفح الـ”ويب كروم”، مبينةً أنه تمّ تصميم البرنامج لعرض التقدم الذي حققته في الحوسبة السحابية، وهو مورد بالغ الأهمية لمطوري الذكاء الاصطناعي، وإنّها دربت “جيميني” باستخدام جيل جديد من المعالجات السحابية القوية التي يمكنها بشكل جماعي تدريب نماذج الذكاء الاصطناعي الكبيرة بشكل أسرع بثلاث مرات تقريباً من الإصدار السابق.
وأوضحت الشركة أنها في اختبار الأنموذج الجديد، تفوق “جيميني” على نماذج الذكاء الاصطناعي المنافسة عبر أكثر من عشرين معياراً يستخدمها عادة باحثو الذكاء الاصطناعي لتقييم فهم القراءة للخوارزمية، والقدرة الرياضية، ومهارات التفكير متعدد الخطوات.
في حين قال “إيلي كولينز” نائب رئيس المنتجات في الشركة في مؤتمر صحفي عبر الإنترنت، الثلاثاء الفائت: “إننا نرى أنها ترسم أنواعاً جديدة من الحدود في جميع المجالات، وإنّ الشركة قامت قامت بالكثير من العمل لتحسين الواقعية في “جيميني”، لكن النماذج اللغوية الكبيرة “لا تزال قادرة على الهلوسة”، وهو مصطلح بحسب خبراء يستخدمه باحثو الذكاء الاصطناعي عندما تختلق أنظمة الذكاء الاصطناعي الحقائق وتخطئ في الأمور، لكن بثقة شديدة.