سيتعين على العالم الانتظار لفترة أطول قليلاً قبل أن يتمكن من تجربة نموذج الذكاء الاصطناعي الأكثر تعقيدًا من Google حتى الآن، حيث تم وصف Gemini بأنه الجيل التالي من الذكاء الاصطناعي والوسائط المتعددة، مما يعني أنه يمكنه معالجة أنواع متعددة من البيانات ويقال إن لديه القدرة على فهم وإنشاء النصوص والصور بالإضافة إلى أنواع أخرى من المحتوى - مثل مواقع الويب - بناءً على رسم تخطيطي أو وصف مكتوب.
وبحسب موقع businessinsider الأمريكى، فأفادت المعلومات، نقلاً عن مصدرين مجهولين على علم بالقرار، أن أحداث الإطلاق غير المعلنة مسبقًا - والتي كان من المقرر إجراؤها في الأصل الأسبوع المقبل في نيويورك وواشنطن وكاليفورنيا - قد تمت إعادة جدولتها بهدوء في أوائل عام 2024 بسبب مخاوف من أن الذكاء الاصطناعي لم يكن كذلك، ويمكن الاعتماد عليه عند الرد على بعض المطالبات والاستفسارات غير الإنجليزية.
وعلى الرغم من أنه لم يتم طرحه للاستخدام العام بعد، فقد قيل إن Gemini يتفوق بقوة على GPT-4 الخاص بـ OpenAI لأنه يسخر قوة حاسوبية أكبر بكثير من منافسه، وقالت سيسي هسياو، نائب الرئيس في Google ومدير Bard وGoogle Assistant، عنه: "مثلًا، أحاول خبز كعكة، ارسم لي 3 صور لـ الخطوات الخاصة بكيفية تزيين كعكة من ثلاث طبقات، وسيقوم جيميني بالفعل بإنشاء تلك الصور.
"وأضافت هسياو: "هذه صور جديدة تمامًا، هذه ليست صورًا من الإنترنت، إنه قادر على التحدث بالصور مع البشر الآن، وليس مجرد نص".
على الرغم من أن جوجل لديها بالفعل نموذج ذكاء اصطناعي خاص بها يسمى Bard، إلا أن ChatGPT يتمتع حتى الآن بوعي أقوى لدى المستهلك - لكن المحللين يقولون إن ذلك قد يتغير عندما يتم إطلاق Gemini أخيرًا.