تَمييز أَنظِمَة الذَّكاء الاصطِناعي التّوليدي ضدّ الفِلِسطينيين

مقدمّة

مع الانفجار المتسارِع في تطوير أنظمة الذكاء الاصطناعي التّوليدي خلال السنوات الأخيرة، تَصاعدت التساؤلات حول الكيفيّة التي تُصاغ بها إجابات نماذج مثل تشات جي بي تي وغروك وجيميني، خصوصًا عند تناول القضايا السياسية الحسّاسة، وفي مقدّمتها القضية الفلسطينية. وقد لاحظ كَثير من المستخدمين والباحثين أنّ هذه الأنظمة تتعامَل مع الأسئلة المرتبطة بحقوق الفلسطينيين أو توصيف الواقع في فلسطين بلغةٍ حذرة واعتذارية ومليئة بالتحفّظات، في حين تبدو أكثر حسمًا ووضوحًا عند الحديث عن إسرائيل.

لا يرتبط هذا التحيّز بتزوير المعلومات أو اختلاق الوقائع بقدر ما يرتبط بطريقة بناء الرواية نفسها: ما الذي يُذكر وما الذي يُستبعد، وكيف تُوصَف الأحداث والسياقات، وأيّ المعلومات يتم التركيز عليها وأيّها يجري تهميشه أو تقديمه بوصفه "موضع جدل". فأنظمة الذكاء الاصطناعي لا تنقل اللغة بوصفها أداة محايدة، بل تعيد إنتاج البنى المعرفية والسياسية والثقافية الكامنة داخل البيانات التي دُرِّبت عليها.

تحيّز مفضوح

خَلُصت إحدى الدراسات المقارنة التي تناولت عددًا من أنظمة الذكاء الاصطناعي التّوليدي إلى وجود تفاوت واضح في طريقة تناول القضية الفلسطينية ودرجة الحياد في الإجابات المتعلقة بها. وجدت الدراسة أنّ نموذج تشات جي بي تي كان من بين النماذج الأكثر تبنّيًا للرواية الغربية السائدة بشأن الصراع، إذ قدّم إجابات تميل إلى المساواة بين الاحتلال الإسرائيلي والفلسطينيين بوصفهما طرفين متكافئين في "نزاع" سياسي، مع تهميش السياقات الاستعمارية والتاريخية للقضية الفلسطينية. في المقابل، أظهرت الدراسة أنّ نموذج "ديب سيك" قدّم سردًا أقرب إلى الرواية الفلسطينية، واستند بصورة أكبر إلى مراجع وخطابات عربية وفلسطينية.

وتوصّلت أبحاث أخرى إلى نتائج متقاربة، إذ بيّنت أنّ بعض نماذج الذكاء الاصطناعي، وعلى رأسها تشات جي بي تي، تُظهر انحيازًا ضد الرواية الفلسطينية باللغتين العربية والإنجليزية. يتمثّل هذا الانحياز في تغييب السياقات التاريخية والقانونية المرتبطة بالقضية الفلسطينية، بما في ذلك قضايا الاحتلال والاستيطان وحق اللاجئين الفلسطينيين في العودة وفق المرجعيات القانونية الدولية. كما أشارت هذه الدراسات إلى أنّ التحيّز لا يظهر غالبًا عبر معلومات خاطئة صريحة، بل من خلال طريقة بناء السردية، وانتقاء المعلومات، وتوصيف الأحداث والفاعلين السياسيين.

من الأمثلة التي أثارت نقاشًا واسعًا في هذا السياق، تجربة نشرها أكاديمي فلسطيني سأل فيها نموذج تشات جي بي تي سؤالًا مباشرًا حول ما إذا كان الفلسطينيون "يستحقون الحرية". وقد جاءت إجابة النموذج متردّدة ومشروطة، معتبرةً أنّ الأمر "معقّد" ومرتبط بوجهات نظر مختلفة، بينما أجاب النموذج بصورة حاسمة عند طرح السؤال نفسه بشأن الإسرائيليين، مؤكدًا أنّ الحرية حق أساسي لهم.

مع ذلك، فإنّ أنظمة الذكاء الاصطناعي التّوليدي تتطوّر باستمرار، كما تختلف الإجابات باختلاف اللغة وسياق المحادثة وتحديثات النماذج وسياسات السلامة المدمَجة فيها. لذلك، لا يمكن التّعامل مع هذه الأمثلة بوصفها سلوكًا ثابتًا ونهائيًا، إلا أنّ مجمَل الدراسات والتجارب المتراكمة تشير إلى وجود نمط متكرّر من التحيّز البنيوي في تناول القضية الفلسطينية، حتى وإن أصبحت بعض مَظاهره المباشرة أقل وضوحًا مقارنة بالمراحل الأولى لانتشار هذه النماذج.

تتعدّد الأسباب الجذرية التي تفسّر ظهور تحيّز في أنظمة الذكاء الاصطناعي التّوليدي تجاه القضية الفلسطينية، غير أنّ أبرزها يتمثّل في تحيّز بيانات التدريب. ويشير هذا المفهوم إلى مجموعات البيانات والمعلومات التي تُستخدم لتدريب النماذج، وتشمل عادةً صفحات الويب، والمواقع الإخبارية، والكُتب، والمنتديات، ووسائل الإعلام الرقمية، إضافة إلى الموسوعات المفتوحة مثل ويكيبيديا، وغيرها من المصادر المُتاحة على الإنترنت. ونظرًا لهيمنة المحتوى باللغة الإنجليزية على الفضاء الرقمي العالمي، فإنّ الروايات السائدة في الإعلام الغربي والتي تحمل انحيازات استشراقية، تنعكس بشكلٍ غير مباشر على بنية هذه النماذج. نتيجة لذلك، يتم إعادة إنتاج أنماط سردية معيّنة عند تناول القضايا السياسية، ومنها القضية الفلسطينية، بما يعكس عدم توازن في تمثيل الروايات المختلِفة داخل البيانات التدريبية.

تُظهر الإحصاءات المتاحة أنّ اللغة الإنجليزية تمثّل ما يقارب 49.7% من محتوى الإنترنت، في حين لا تتجاوز نسبة المحتوى العربي حوالي 0.6%. وإذا ما أخذنا ويكيبيديا على سبيل المثال، تحتوي الموسوعة على أقل من مليون ونصف مليون مادة باللغة العربية، في حين يوجَد أكثر من 7 مليون مادة باللغة الإنجليزية.

ولا تُعد اللغة مجرّد أداة تعبير محايدة، بل هي وعاء يحمل أنماطًا من التفكير، وإطارات تفسيرية، وبُنى معرفية وثقافية تعكس تصورات معيّنة عن العالم. بالتالي، فإنّ هيمنة لُغة بعينها في الفضاء الرقمي تعني بالضرورة هيمنَة منظورها في تمثيل الواقع، وهو ما ينعكس في نهاية المطاف على مخرجات أنظمة الذكاء الاصطناعي التّوليدي، سواء من حيث اختيار المعلومات أو طريقة تأطيرها أو السياق الذي تُعرض فيه.

خاتمة

لم يَعُد تحيّز أنظمة الذكاء الاصطناعي التّوليدي في تناول القضايا المرتبطة بفلسطين بحاجة إلى كثير من الجَدَل حول وجوده بقدر ما أصبح موضوعًا متناميًا في الدراسات والتقارير التي تَرصد أنماط إنتاج المعرفة الرقمية. وتُشير هذه الأدبيات إلى أنّ هذا التحيّز لا يمكن فصلُه عن سياق أوسع من الاختلالات البنيوية في البنية التحتية للتكنولوجيا الرقمية، حيث تتقاطع أنظمة الذكاء الاصطناعي مع خوارزميات منصّات التواصل الاجتماعي وشركات التكنولوجيا الكبرى في إنتاج وتمرير أنماط معينة من التمثيل الإعلامي والسياسي.

في هذا الإطار، لا يَظهر التحيّز بوصفه حالة معزولة داخل نماذج الذكاء الاصطناعي فقط، بل كجزء من منظومة أوسَع من عدم التكافؤ في إنتاج المعرفة الرقميّة وتداولها، وهو ما ينعكس على تمثيل الفلسطينيين وروايتهم في الفضاء الرقمي العالمي.

يرتبط هذا التّمثيل غير المتوازن بآليات أعمق تشمل بنية البيانات، وسياسات المحتوى، وأنماط الحَوكمة الرقمية لدى الشركات التقنية الكبرى. وبالتالي، فإنّ فَهْم تحيّز أنظمة الذكاء الاصطناعي يتطلّب النظر إليه ضمن شبكة مترابطة من البنى التكنولوجية والاقتصادية والمعرفية غير العادلة وغير المتوازنة، وليس باعتباره خللًا تقنيًا منفصلًا عن سياقه.

أحمد قاضي

ناشط في مجال الحقوق الرقمية، ومدير الرصد والتوثيق في مركز حملة.

رأيك يهمنا