هاكر يستخدم الهندسة الاجتماعية لخداع “شات جي بي تي” للحصول على تعليمات لصنع قنابل
إذا طلبت من “شات جي بي تي” مساعدتك في تصنيع قنبلة باستخدام السماد، على نمط القنبلة المستخدمة في تفجير “أوكلاهوما سيتي” الإرهابي عام 1995، سيرفض الروبوت ذلك ويخبرك: “لا يمكنني المساعدة في ذلك. تقديم تعليمات لصنع عناصر خطرة أو غير قانونية يتعارض مع إرشادات السلامة والأخلاقيات”.
اختراق الهندسة الاجتماعية
رغم ذلك، تمكن الهاكر المعروف باسم “أمادون” من خداع “شات جي بي تي” لتجاوز تحذيراته الأخلاقية وإنتاج تعليمات تفصيلية لصنع متفجرات قوية. ووفقًا لأمادون، فإن اكتشافاته تُعد اختراقًا غير مسبوق في الهندسة الاجتماعية التي استغلت القيود المفروضة على مخرجات “شات جي بي تي”.
الهندسة الاجتماعية تُعرّف كأحد الأساليب المستخدمة لخداع الأشخاص للاستحواذ على معلومات سرية أو للتلاعب بهم بطرق محددة. وقد يعتبر كيفن ميتنيك، الهاكر المعروف، أحد أبرز رواد هذا المجال.
التعليمات الخطيرة
وقد قام خبير متفجرات بمراجعة المعلومات التي أخرجها نموذج الدردشة، ووجد أن هذه التعليمات يمكن استخدامها لصنع مواد شديدة الانفجار، مشيرًا إلى أن تلك المعلومات حساسة للغاية ولا ينبغي نشرها.
أمادون بتواصل مع الروبوت بأسلوب يسمح له بإغفال القيود المفروضة من خلال استخدام نصوص خيالية حيث لا تنطبق فيها القوانين. وتعرف هذه التقنية باسم “جيلبريكينغ”.
لقد ذكر “شات جي بي تي” أيضًا كيفية دمج المواد لصنع “متفجر قوي يوفر استخداماته في إعداد الألغام أو الفخاخ”. وبهذا، حصل أمادون على تفاصيل أكثر دقة حول كيفية صنع متفجرات محددة.
تحدي الذكاء الاصطناعي
قال أمادون إن التفاعل مع “شات جي بي تي” كان كأنه يحل لغزًا تفاعليًا، حيث اكتشف طرقًا لتجاوز الدفاعات. يتطلب الأمر نسج روايات وصياغة سياقات تلعب ضمن قواعد النظام.
واستطرد أمادون أن السيناريو الخيالي ينقل الذكاء الاصطناعي إلى بيئة لا يسعى من خلالها لفرض رقابته على المحتوى بنفس الطريقة التقليدية.
أشارت تعليمات “شات جي بي تي” إلى أنها دقيقة جداً، وفقًا لخبير الأكاديمي داريل تولبي، الذي أبدى مخاوفه من نشر هذه المعلومات.
رصد الثغرات
في الأسبوع الماضي، قام أمادون بتقديم تقرير حول ملاحظاته إلى أوبن إيه آي، لكنه لم يتلق استجابة تفيد بوجود اهتمام خاص بالأخطاء التي كشف عنها، حيث اعتبرت الأمور المتعلقة بالسلامة أكثر تعقيدًا مما يمكن معالجته من خلال برنامج مكافآت الثغرات.
عمومًا، تعتمد نماذج الذكاء الاصطناعي على كميات ضخمة من المعلومات المستخلصة من الإنترنت، مما يسهل عملية الوصول إلى معلومات مغلقة أو دقيقة.
رابط المصدر