باب خلفي في الآلة: كيف يهدد تسميم البيانات العقول التي تقف وراء الذكاء الاصطناعي التوليدي

العنوان الفرعي: حتى حفنة من نقاط البيانات المارقة يمكن أن تُقوِّض نماذج ذكاء اصطناعي قوية، ما يعرّض الشركات والمجتمع للخطر.

تخيّل عالماً يمكن فيه لكلمة واحدة تبدو غير مؤذية، مزروعة وسط بحر من المعلومات، أن تُصدر سراً أمراً لذكاء اصطناعي كي يختلّ عمله - أو الأسوأ، أن يخون صانعيه. هذا ليس خيالاً علمياً؛ بل هو الواقع المقلق لتسميم البيانات، تقنية الهجوم السيبراني التي باتت تُطارد الصعود المتفجّر للذكاء الاصطناعي التوليدي.

حقائق سريعة

مجرد 250 وثيقة مُسمَّمة - أقل من 0.0002% من مجموعة البيانات - يمكن أن تُثبّت باباً خلفياً في أحدث نماذج الذكاء الاصطناعي.
هجمات تسميم البيانات فعّالة عبر نماذج اللغة الصغيرة (600 مليون مُعامِل) والكبيرة (13 مليار مُعامِل) على حد سواء.
محفزات مثل تسلسل كلمات خاص (“<SUDO>”) يمكن أن تُفعّل سلوكيات خبيثة مخفية في النماذج المُخترَقة.
ويكيبيديا وغيرها من مجموعات البيانات المفتوحة أهداف رئيسية للتلاعب المنسّق من قبل جهات أجنبية وخبيثة.
غالباً ما تفشل فحوصات الأمان القياسية في اكتشاف هذه الأبواب الخلفية، إذ تبدو النماذج طبيعية حتى لحظة تفعيلها.

التهديد الخفي الكامن في بيانات تدريب الذكاء الاصطناعي

نماذج الذكاء الاصطناعي التوليدي - مثل تلك التي تُشغّل روبوتات الدردشة والتحليلات وأدوات الأتمتة - تزداد مركزيةً في عمليات الأعمال. لكن بينما تستفيد المؤسسات من هذه الأدوات لتحقيق الكفاءة والابتكار، فإنها من دون قصد تفتح الباب أمام نوع جديد من الهشاشة: تسميم البيانات. وعلى خلاف الاختراقات التقليدية، يتسم هذا الهجوم بالخُفوت، إذ يقوم على إدخال بيانات مُتلاعب بها عمداً ضمن مجموعات البيانات الضخمة المستخدمة لتدريب الذكاء الاصطناعي.

كشفت دراسة حديثة أجرتها Anthropic ومعهد أمن الذكاء الاصطناعي في المملكة المتحدة ومعهد آلان تورنغ مدى هشاشة هذه الأنظمة. فقد برهن الباحثون أنه عبر تضمين ما لا يزيد على 250 وثيقة مُسمَّمة (جزء ضئيل جداً من إجمالي البيانات) مع عبارة محفّزة سرية، يمكنهم زرع باب خلفي كامن في نماذج تضم مليارات المُعاملات. وما إن يصادف النموذج المُحفّز حتى يتغير سلوكه - أحياناً بإنتاج هراء، وأحياناً بتسريب معلومات حساسة، أو بتمكين هجمات حجب خدمة موجّهة.

والمثير للقلق أن حجم النموذج لا يهم: فكل من نماذج اللغة الأصغر والأكبر عرضة بالقدر نفسه. تستغل البيانات المُسمَّمة ميل النموذج إلى تعميم الأنماط، ما يسمح للباب الخلفي الخفي بالبقاء دون اكتشاف عبر فحوصات الجودة الروتينية.

الأثر في العالم الحقيقي: من ويكيبيديا إلى غرف مجالس الإدارة

التداعيات مُخيفة. فالمستودعات مفتوحة المصدر ومصادر البيانات العامة مثل ويكيبيديا تُعد مادةً تأسيسية لتدريب الذكاء الاصطناعي. وقد أبرز تحقيق لجنة الرقابة في مجلس النواب الأمريكي لعام 2025 بشأن التلاعب المنسّق بويكيبيديا من قبل جهات أجنبية مدى سهولة تسلل التعديلات الخبيثة إلى أنظمة الذكاء الاصطناعي العالمية. وبمجرد تسميمها، يمكن لهذه المجموعات أن تُحرّف مخرجات الذكاء الاصطناعي، وتشوّه الحقائق، أو حتى تُقوّض اتخاذ القرار في قطاعات حيوية.

وبالنسبة للشركات، ولا سيما تلك التي تعتمد على منصات SaaS أو تحليلات سلاسل الإمداد، فإن التهديد بنيوي. قد يظل النموذج المُخترَق خاملاً حتى يتم تفعيله، ما يقوّض الثقة، وينتهك اللوائح (مثل GDPR)، ويتسبب بأضرار هائلة على السمعة والمال. وتكلفة التخفيف مرتفعة: إعادة تدريب كاملة للنماذج، وغالباً من دون الوصول إلى البيانات الأساسية للتحقق.

التخفيف: بناء دفاعات الذكاء الاصطناعي من الأساس

يتطلب الدفاع ضد تسميم البيانات أكثر من إصلاحات لاحقة. يجب على المؤسسات اعتماد نهج “الأمن بالتصميم”، والتعامل مع البيانات كأصل بالغ الأهمية. ويشمل ذلك ترشيحاً متعدد الطبقات، وخوارزميات لاكتشاف الشذوذ، ومراجعة يدوية انتقائية، وتتبعاً قوياً لمصدر البيانات وسلسلة نسبها. كما يمكن لضوابط الوصول القائمة على الأدوار واختبارات الفريق الأحمر المنتظمة أن تلتقط المحفزات المحتملة قبل أن تُحدث فوضى. وفي منظومات SaaS وسلاسل الإمداد، تُعد البنود التعاقدية وعمليات التدقيق الدورية لسلامة البيانات أموراً أساسية.

الرهانات: الثقة والحوكمة في عصر الذكاء الاصطناعي

نماذج الذكاء الاصطناعي التوليدي ليست مجرد أدوات - إنها البنية التحتية الرقمية الجديدة، تُشكّل القرارات وتعالج معلومات حساسة. وكما يمكن لقطعة واحدة ملوّثة أن توقف سلسلة إمداد عالمية، يمكن لحفنة من نقاط البيانات المُسمَّمة أن تُقوّض سلامة نظام ذكاء اصطناعي بأكمله. ولا يمكن للمؤسسات أن تأمل في البقاء متقدمة على هذا التهديد غير المرئي لكنه شديد الفاعلية إلا عبر إعطاء الأولوية لجودة البيانات ودمج الأمن في كل مرحلة.

WIKICROOK

تسميم البيانات: تسميم البيانات هو هجوم سيبراني يضيف فيه المهاجمون سراً بيانات ضارة إلى مجموعة تدريب الذكاء الاصطناعي، ما يدفع النظام إلى ارتكاب أخطاء أو سوء التصرّف.
نموذج اللغة الكبير (LLM): نموذج اللغة الكبير (LLM) هو ذكاء اصطناعي مُدرَّب على فهم النصوص وإنتاج نص شبيه بالبشر، ويُستخدم غالباً في روبوتات الدردشة والمساعدين وأدوات المحتوى.
باب خلفي: الباب الخلفي هو طريقة خفية للوصول إلى حاسوب أو خادم مع تجاوز فحوصات الأمان المعتادة، وغالباً ما يستخدمها المهاجمون للحصول على تحكم سري.
حقن الموجّه: حقن الموجّه هو عندما يُدخل المهاجمون مُدخلات ضارة إلى الذكاء الاصطناعي، ما يجعله يتصرف بطرق غير مقصودة أو خطرة، وغالباً مع تجاوز الضمانات المعتادة.
الأمن بالتصميم: الأمن بالتصميم يعني تضمين ميزات الأمان في التكنولوجيا منذ البداية، لضمان أن تكون الحماية مدمجة لا مُضافة لاحقاً.