عهد جيميناي.. الأساسيات المعلن عنها غوغل في مؤتمر المطورين “آي/ أو” 2024
اختتم الرئيس التنفيذي لغوغل، سوندار بيتشاي، الكلمة الاستهلالية بإشارة إلى أنه “ذكر كلمة الذكاء الاصطناعي خلال مداخلته في الحدث 121 مرة”، مما يؤكد أهمية هذا المجال وتحديثاته وتطوراته بالنسبة للشركة العملاقة. وهذا نبذة عن البيانات الرئيسية التي صدرت في الكلمة الاستهلالية لمؤتمر غوغل “آي/ أو”.
عهد جيميناي
أشار بيتشاي إلى أن نسخة “جيميناي 1.5 برو” ستضيف اطارًا أوسع للسياق يصل إلى 2 مليون “توكين” (Token)، وهي كمية المعلومات التي يستطيع نموذج الذكاء الاصطناعي فهمها، في حين أن النسخة الحالية تملك مليون توكين.
أضافت غوغل مجموعة من الميزات الجديدة إلى نموذج “جيميناي” للذكاء الاصطناعي، ومن أبرز تلك الميزات خيار الشخصنة المعروف بـ “جيمز” (Gems)، الذي يسمح للمستخدمين بإنشاء نسخ فريدة من النموذج بشخصيات متنوعة.
يتيح “جيمز” إنشاء نسخ من الروبوتات المحادثة التي يمكنها المساعدة في مهام معينة والاحتفاظ بخصائص محددة، وهو يشبه إلى حد كبير عملية إنشاء الروبوتات المخصصة في منصة “كاراكتر إيه آي”(Character.AI)، خدمة تسمح بالتحدث إلى نسخ افتراضية من الشخصيات العامة والمشاهير أو حتى طبيب نفساني افتراضي.
يظهر تلك الميزة تشابهًا مع متجر “جي بي تي” الخاص بشركة أوبن إيه آي الذي يسمح بإنشاء نسخ مخصصة من الروبوتات المحادثة في “شات جي بي تي”.
سيحصل مساعد الذكاء الاصطناعي “جيميناي” على تحديثات لمهارات المحادثة الصوتية لمشتركي خدمة “جيميناي أدفانست” خلال هذا العام.
“جيميناي لايف” (Gemini Live) ستمكن من إجراء محادثة صوتية مع الروبوت المحادثة، مما يضيف إليه قدرات المساعد الذكي وخصائص الرؤية، وهو ما يشبه الخدمة التي أعلنت عنها “أوبن إيه آي” لنموذج “جي بي تي-4 أو”.
يذكر غوغل أن مساعد الذكاء الاصطناعي سيعتمد على أنماط كلام المستخدمين، وسيقدم ردودًا موجزة ومختصرة بشكل أكبر من الردود النصية الطويلة التي يتم تقديمها بشكل عام.
سوف تتوفر هذه الميزة ب 10 خيارات صوتية، وتستطيع الشركة استخدام كاميرات الهواتف الذكية لرؤية وتحليل مقاطع الفيديو في الوقت الحقيقي.
يمكن استخدامها أيضًا في تنفيذ مهام المساعد الرقمي، مثل تحديث التقويم الشخصي، عن طريق الحصول على المعلومات من منشور لحفل موسيقي التقطه المستخدم على سبيل المثال.
كما دعت غوغل إلى تحديث نموذج “جيميناي” على نظام أندرويد للاستفادة الأفضل من عرض شاشة الهاتف.
على سبيل المثال، يمكن للمستخدم الآن تحديد “جيميناي” كمساعد رقمي افتراضي على هاتف أندرويد، ليقوم بتلخيص المحتوى أو الإجابة على أسئلة حول صفحة الويب التي يتصفحها أو لقطة الشاشة التي يفتحها أمامه. في المستقبل، سيتمكن أيضا من ملاحظة وجود مقطع فيديو على الشاشة وطلب الاستفسار حوله.
تستخدم النماذج الكلمات النصية التلقائية للفيديو لإيجاد الإجابات، ويمكنك الآن الحصول على ذلك بطرق مختلفة.
تحديثات قوية
منذ عام وفي نسخة المؤتمر 2023، ذكرت غوغل أنها ترى الذكاء الاصطناعي مستقبل البحث على الإنترنت. وفي نسخة هذا العام، بدأت الرؤية تتضح أكثر، إذ ستطرح غوغل “ملخصات الذكاء الاصطناعي” (AI Overviews)، التي كانت تعرف سابقًا ب “تجربة البحث التوليدية” (SGE)، للمستخدمين في الولايات المتحدة وسيتم طرحها في جميع أنحاء العالم قريبًا.
في المستقبل القريب، سيرى ملايين من مستخدمي غوغل ملخصًا مولدًا بواسطة الذكاء الاصطناعي في أعلى نتائج البحث، وربما سيكون هذا البداية لتغيير كيفية استخدام الذكاء الاصطناعي لتجربة البحث على محرك البحث.
في المؤتمر، قدمت غوغل نسخة أولية من ما تأمل الشركة أن تكون المساعد الشخصي الشامل، وقد أطلقت عليه “مشروع أسترا” (Project Astra)، وهو مساعد ذكي متعدد الوسائط يعمل بالذكاء الاصطناعي في الوقت الحقيقي، ويمكنه رؤية العالم ومعرفة أماكن الأشياء الجسمية ومكان تركها، بالإضافة إلى مساعدتك في أي شيء تقريبًا، وهو نوع من وكلاء الذكاء الاصطناعي (AI Agents)، وهي روبوتات تقوم بتنفيذ المهام المختلفة نيابة عن المستخدم.
كما أعلنت الشركة عن نموذج جديد، يُعرف باسم “جيميناي 1.5 فلاش” (Gemini 1.5 Flash)، مصمم لتنفيذ المهام بسرعة أكبر، مثل تلخيص المحتوى وتعليق على مقاطع الفيديو. بالإضافة إلى نموذج جديد آخر، يسمى “فيو” (Veo)، يمكنه توليد مقطع فيديو استنادًا إلى التوجيه النصي الذي يتلقاه من المستخدم.
أما بالنسبة لنموذج “جيميناي نانو”، المصمم للاستخدام الداخلي على الأجهزة كالهواتف الذكية وأجهزة الحواسيب الشخصية، سيصبح أسرع بكثير من الماضي.
ستضيف الشركة هذا الإصدار الخفيف من “جيميناي” إلى متصفح كروم على أجهزة الكمبيوتر، وسيستخدم الذكاء الاصطناعي على الجهاز لمساعدة المستخدم في إنشاء نصوص لمشاركات وسائل التواصل الاجتماعي والتعليق على المنتجات ومراجعاتها والكثير من المهام الأخرى.تحديث مباشر لمتصفح غوغل كروم.
المزايا الجديدة
ذكرت الشركة خلال مؤتمر المطورين عن خطتها لإطلاق نموذجها الحديث “جيميناي 1.5 برو” في قائمة جانبية لتطبيقات مستندات غوغل وجداول البيانات والعروض التقديمية وخدمة “جيميل”. سيكون المساعد الرقمي نفسه متواجدًا في كل هذه التطبيقات، والأهم هو أنه سيكون على علم بكل ما قام المستخدم بحفظه في أي مكان. تهدف هذه الفكرة إلى استخدام “جيميناي” لربط جميع تطبيقات “وركسبيس” بشكلٍ أكثر سلاسة.
ستتوفر نسخة من المساعد الرقمي “جيميناي” في تطبيق جيميل على الهواتف الذكية ابتداءً من الشهر المقبل، لمشتركي خدمة “وركسبيس” وخدمة “إيه آي بريميوم” ضمن اشتراك “غوغل وان”، وتشير الشركة إلى إمكانية للمستخدمين طرح الأسئلة حول رسائل البريد الإلكتروني أو تقديم الردود استنادًا إلى سياق تلك الرسائل.
بالإضافة إلى القدرات المتميزة لخدمة “صور غوغل” في البحث، ستستفيد غوغل من روبوت “جيميناي” للإرتقاء بهذه القدرات إلى مستوى أعلى، من خلال إضافة ميزة “اطرح سؤال حول الصور” “Ask Photos” الجديدة التي ستصبح متوفرة في تطبيق الصور هذا الصيف مما سيجعله أكثر ذكاءً في فهم ما يبحث عنه المستخدم، باستخدام الذكاء الصناعي لربط العناصر والحصول على نتائج شديدة التعقيد.
وتوفر ميزة جديدة في خدمة “Google Lens” إمكانية البحث عبر الإنترنت من خلال تصوير فيديو بكاميرا الهاتف وطرح السؤال على المساعد للبحث عن إجابة على الشبكة العنكبوتية. يأتي هذا نتيجة الإطار الواسع الذي يمتلكه نموذج “جيميناي”، مما يعني أنه قادر على الوصول لكم هائل من المعلومات في وقت واحد.