“سيما”.. عينة ذكاء صناعي تصل إلى ألعاب الفيديو

By العربية الآن



“سيما”.. عينة ذكاء صناعي تصل إلى ألعاب الفيديو

هاتف الخاص بالألعاب “xperia 1 iv gaming” من sony
سيما يلعب جنباً إلى جنب مع اللاعبين فهو يتصرف على شكل اللاعب البشري من خلال اتباع تعليمات لفظية (مواقع التواصل الاجتماعي)
الأشخاص في ألعاب الفيديو التي يتحكم فيها بواسطة الحاسوب ليست جديدة. فالأشخاص التي يتحكم بها الحاسوب هم من العناصر الأساسية في عالم الألعاب منذ وقت طويل. ولكن اليوم ظهر نموذج مميز وجديد في مجال الألعاب ذات التحكم الذاتي بواسطة الحاسوب والذي سيحدث تغييراً في عالم الألعاب.

سيما (SIMA) هو نموذج مطور في عالم ألعاب الفيديو والمعروف بالوكيل المتعدد المهام والقابل للتعلم والتوجيه والذي يعتمد على الذكاء الاصطناعي التوليدي لأمور غير مألوفة في الألعاب الشائعة في الوقت الراهن.

ما هو سيما؟

يصف مختبر أبحاث الذكاء الاصطناعي غوغل ديب مايند نموذج سيما بأنه “وكيل ذكاء اصطناعي”، والذي يختلف عن النماذج الأخرى مثل شات جي بي تي وجيميني، يُدرب وكلاء الذكاء الاصطناعي على مجموعة كبيرة من البيانات، كما يمكنهم معالجة البيانات واتخاذ الإجراءات بأنفسهم.

سيما سيكون قادر على أداء مهام متنوعة، إنه كصديق افتراضي يمكنه فهم التعليمات واتباعها في جميع أشكال البيئات الافتراضية من استكشافمن السجون الغامضة إلى إقامة الحصون الراقية، يُمكن له إنجاز المهام أو إيجاد حلول للتحديات المُسندة إليه.

وبخلاف الشخصيات غير القابلة للعب، يتحكم في سيما الذكاء الاصطناعي الغير مبرمج في لعبة محددة ليتصرف بطريقة معينة أو يُستجيب لإجراءات محددة يُقدمها البشر. تُعرفه غوغل باسم وكيل ذكاء اصطناعي عام لبيئات الواقع الافتراضي الثلاثية الأبعاد.

طريقة العمل؟

سيما ليس لديه أي وصول إلى خوارزميات اللعبة أو القواعد الداخلية، بل يتلقى تدريبًا شاملًا من خلال مشاهدة فيديوهات تظهر أساليب لعب اللاعبين العاديين. ومن خلال هذه البيانات والتعليمات المُقدمة، يتعلم الربط بين التمثيلات البصرية ليقوم بالإجراءات والتفاعلات. كما يتعلم من مشاهد لاعبين يُوجهون بعضهم بعضًا للقيام بأشياء معينة في اللعبة.

لعله يتعلم كيفية حركة وحدات الصور بنمط معين على الشاشة من أجل “التقدم”، أو عندما يقترب شخصية ما من بوابة وتستخدم مقبضًا ما، ذلك يُعني “فتح الباب”. أمور بسيطة كهذه، مهام تأخذ بضع ثوانٍ ولكنها تعد أكثر من مجرد ضغطة زر أو تحديد شيء ما.

يُشارك سيما اللاعبين مباشرةً في قِصة اللعبة بتفاعله كلاعب بشري من خلال اتباع توجيهات شفهية، حيث تم تصميمه ليكون مساعدًا للعبة وليس خصمًا منافسًا.
وتقول غوغل: “سيما ليس مدرب على الفوز في اللعبة، بل تم تجهيزه للتعاون مع اللاعب وتنفيذ الإجراءات بناءً على تعليمات اللغة الطبيعية”. كما نوهت إلى أن سيما يعمل كزميل للعبة يحاول تنفيذ كل طلب يُوجه له من قِبل اللاعب البشري.

وأضافت غوغل أن سيما بحاجة فقط للصور المقدمة من البيئة ثلاثية الأبعاد وتعليمات اللغة التي يُقدمها المستخدم. ومن خلال إدخالات الماوس ولوحة المفاتيح، تُقيّم 600 مهارة تشمل مجالات مثل التنقل وتفاعل الكائنات وغيرها. فهو يفهم الجمل مثل “انعطف لليسار” أو “اقطع الشجرة” وينفذها.

محرك سيما اختبر على 9 ألعاب منها “نو مانز سكاي” ولعبة “إيكو” و “تيرداون” و “جوت سيميليتور” وغيرها (موقع غوغل ديب مايند)

كيف يفهم سيما الألعاب الالكترونية

وفقًا لتقرير غوغل، فإن النموذج الذي تدرب على مُجموعة واسعة من الألعاب كان أفضل من الذي تعلم كيفية اللعب في لعبة واحدة فقط. فقد تفوقت نماذج سيما التي تم تدريبها على تنوع من الألعاب ثلاثية الأبعاد بصورة ملحوظة على جميع النماذج المتخصصة التي تدربت في لعبة واحدة فقط.

تم إجراء هذه الاختبارات على 9 ألعاب منها “نو مانز سكاي” و”إيكو” و”تيرداون” و”جوت سيميليتور” وغيرها. ومن خلال التجارب على هذه الألعاب، فقد كان أداء الوكيل الذي تدرب في كل الألعاب ما عدا واحدة متميزًا بنفس القدرة في تلك اللعبة التي لم يُدرَّب عليها سابقًا.

تُسلط هذه التحديات الضوء على قدرة سيما على تعميم المهارات المكتسبة خارج نطاق التدريب في بيئات جديدة. وتُعتبر هذه النتائج الأولية واعدة، ولكن هناك حاجة إلى المزيد من البحث ليُمكن هذا المساعد من تحقيق أداء قريب من مستوى الإنسان في كل من الألعاب المرئية وغير المرئية.

خصائص سيما

يتضمن نموذج غوغل لألعاب الفيديو “سيما” مميزات متطورة تمكنه من التفاعل داخل بيئات محاكاة ثلاثية الأبعاد مُتنوعة. تُعتبر هذه الميزات جزءًا أساسيًا من تصميمه، مما يُمكنه من فهم وتنفيذ تعليمات اللغة الطبيعية وأداء العديد من الإجراءات. وتُبرز بعض هذه الميزات:

– نقل المعرفة إلى بيئات مُختلفة: من الخصائص الرئيسية لسيما أنه يستطيع استعمال المهارات التي اكتسبها في بيئة ما ليحقق أداء ممتاز في بيئة أخرى دون الحاجة للبدء من جديد في كل مرة. تُعد هذه القدرة على التنقل بين البيئات شديدة الأهمية لمرونة النموذج وفاعليته. فهذا يمكنه من استغلال المعارف التي اكتسبها في مجموعة كبيرة من السيناريوهات بدلاً من سيناريو واحد فقط.

على سبيل المثال، إذا توصّل النموذج لمفهوم “فتح الباب” في إحدى الألعاب، فبإمكانه توظيف تلك المعرفة عند وجود باب في لعبة أخرى غير مرتبطة. تعمل أنظمة الإدراك والتفاعل المُتقدمة للوكيل على تسهيل رسم خريطة للمفاهيم المُشتركة من خلال استخلاص الشبه الأساسي في التفاعلات عبر البيئات وتسريعتكييفها.

– فهم توجيهات اللغة الطبيعية: تم تصميمها خصيصاً لفهم مجموعة واسعة من التوجيهات اللغوية وتفسيرها ضمن سياق بيئتها وأهدافها الحالية. يمتد هذا الفهم ليشمل الأوامر المعقدة وتسلسلات التوجيهات، مما يمكنها من المشاركة في التفاعلات المتقدمة وإتمام المهام المعقدة وفقًا لمُدخلات اللغة الشبيهة بتلك للإنسان.

– تنفيذ أكثر من 600 حركة: نظراً لتنوع بيئات التدريب وتعقيد المهام التي يمكنها التعامل معها، النموذج قادر على تنفيذ أكثر من 600 حركة مختلفة، وذلك بفضل وفرة حركته، إذ تمكنه من الاستجابة بشكل صحيح لمختلف السياقات والتوجيهات.

النموذج قادر على أداء تنوع واسع من المهام؛ إذ تُعتبر شريكًا افتراضيًا يمكنه فهم التوجيهات والامتثال لها في كل أصناف البيئات الافتراضية (غيتي إيميجز)

تحديات تطوير النموذج

واجه الفريق البحثي في ديب مايند العديد من التحديات الصعبة أثناء تطوير النموذج. تنشأ هذه التحديات نتيجة لتدريب الذكاء الاصطناعي في بيئات ثلاثية الأبعاد مختلفة ومتنوعة، وسنستعرض أبرز هذه التحديات التي واجهت المطورين:

– بيئات الوقت الحقيقي غير ملائمة لنماذج مثل هذا النموذج: يُدرب النموذج في بيئات الوقت الحقيقي التي تتطلب الاعتماد على الزمن الفعلي، خصوصًا ألعاب الفيديو التجارية، وتُعد هذه البيئات متغيرة وليست مصممة خصيصاً لوكلاء الذكاء الاصطناعي مثل النموذج. تم تصميم تلك البيئات للاعبين البشر وتحتوي على تفاصيل دقيقة وديناميات يمكن أن تكون تحديًا للذكاء الاصطناعي في التنقل والفهم.

– محدودية البيانات: يُعني تقييم أداء النموذج دون إمكانية الوصول إلى واجهة برمجة التطبيقات أن الوكيل لن يكون قادراً على الاعتماد على سيناريوهات بيئية محددة أو ميكانيكيات اللعبة الأساسية التي غالبًا ما تكون متوفرة للمطورين. هذا القيد يستلزم الاعتماد على الإشارات البصرية والنصية فقط، مما يعكس تجربة لعب الإنسان ولكنه يثير تحديات كبيرة في تفسير البيئة بدقة وتقديم ردود فعل مناسبة.

– دقة التقدير: يُعقد عدم القدرة على الوصول المباشر إلى حالة البيئة عملية تقييم النموذج، مما يجعل من الصعب التأكد مما إذا كان الذكاء الاصطناعي قد فهم ونفذ مهمة محددة بنجاح، وخصوصاً في السيناريوهات المعقدة أو الغامضة.

المصدر: الجزيرة + مواقع إلكترونية



أضف تعليق

For security, use of Google's reCAPTCHA service is required which is subject to the Google Privacy Policy and Terms of Use.

Exit mobile version