ما الذي يكشفه اختبار ستروب عن اختلافات الانتباه بين الذكاء الاصطناعي والإنسان؟

في دراسة حديثة، قام فريق من الباحثين بقيادة سوكيتو باتل بفحص كيفية استجابة نماذج الذكاء الاصطناعي المتقدمة لمهمة نفسية شهيرة تُعرف باختبار ستروب. هذا الاختبار يعكس تحديات تتعلق بالانتباه والتركيز التي تواجهها الدماغ البشري. النتائج أظهرت اختلافات جوهرية بين معالجة المعلومات لدى الأنظمة الاصطناعية والدماغ البشري.

فهم اختبار ستروب

يُعتبر اختبار ستروب من الاختبارات النفسية الكلاسيكية التي تستخدم منذ عقود لدراسة مهارات الانتباه والتركيز والسيطرة الذاتية. في هذا الاختبار، تُعرض كلمات مثل “أحمر” و”أزرق” و”أخضر” مكتوبة بأحبار ملونة. في بعض الأحيان تتطابق الكلمة مع لون الحبر، وفي أحيان أخرى لا تتطابق، مثل كلمة “أحمر” مكتوبة بحبر أزرق.

المشاركون يُطلب منهم تسمية لون الحبر بدلاً من قراءة الكلمة. رغم أن المهمة تبدو بسيطة، إلا أنها تتطلب من الدماغ كبت الرغبة الطبيعية في قراءة الكلمة والتركيز بدلاً من ذلك على تحديد لون الحبر. يُستخدم هذا الاختبار لقياس القدرة على التحكم التنفيذي، وهي مجموعة من العمليات العقلية التي تساعد الناس على تنظيم الانتباه ومقاومة الانحرافات والتركيز على الأهداف.

كيف يتعامل الذكاء الاصطناعي مع اختبار ستروب

هدفت الدراسة إلى معرفة مدى قدرة نماذج اللغة الكبيرة، مثل ChatGPT وClaude وGemini، على التعامل مع هذا التحدي بنفس الطريقة التي يتعامل بها البشر. هذه النماذج تُدرب على كميات هائلة من النصوص وتتعلم أنماط اللغة لتوليد استجابات تبدو بشرية بشكل ملحوظ.

عندما عُرضت على قوائم قصيرة تحتوي على خمس كلمات لونية، أدت النماذج أداءً جيدًا، حتى عندما لم تتطابق الكلمات مع الألوان. لكن الأمور تغيرت بشكل كبير عندما زادت طول القوائم.

على سبيل المثال، حقق GPT-4o دقة بلغت 91% مع خمس كلمات، ولكن عند التعامل مع عشر كلمات انخفضت الدقة إلى 57%، ومع أربعين كلمة انخفضت الدقة إلى 15% فقط. بينما حافظ Claude 3.5 Sonnet على أداء مستقر مع قوائم من عشرين كلمة، لكنه شهد تراجعًا حادًا إلى دقة 24% مع قوائم من أربعين كلمة.

لماذا يفقد الذكاء الاصطناعي التركيز؟

أصبحت التحديات أكثر تعقيدًا عندما ظهرت الكلمات اللونية المتطابقة وغير المتطابقة معًا في نفس القائمة. تحت هذه الظروف، تدهور الأداء بشكل أكبر، حيث انخفضت دقة العناصر غير المتطابقة إلى ما يقرب من الصفر في بعض الحالات.

لاحظ الباحثون أن النماذج الذكاء الاصطناعي واجهت صعوبة في الحفاظ على التعليمات لتحديد ألوان الحبر وبدلاً من ذلك بدأت في قراءة الكلمات نفسها. يبدو أن الأنظمة لم تتمكن من كبت الاستجابة التي تم تدريبها بشكل مكثف على إنتاجها.

من المثير للاهتمام أن البشر يواجهون صراعًا مشابهًا، إذ إنهم عمومًا أفضل في قراءة الكلمات من تسمية ألوان الحبر. ومع ذلك، يستطيع معظم الأفراد الحفاظ على دقة عالية وأداء مستقر حتى عند مواجهة قوائم طويلة من الكلمات والألوان المتضاربة.

الفرق بين الانتباه البشري والذكاء الاصطناعي

تسلط الدراسة الضوء على الفروق الهامة بين الذكاء البشري والاصطناعي. على الرغم من أن الأنظمة الذكاء الاصطناعي الحديثة يمكنها أن تنتج قدرات لغوية ومنطقية مذهلة، إلا أن الآليات الأساسية لها تختلف عن عمليات الانتباه الموجودة في الدماغ البشري.

البشر غالباً ما يستطيعون الحفاظ على تركيزهم على هدف محدد مع تصفية المعلومات المتنافسة. تشير النتائج إلى أن النماذج الذكاء الاصطناعي الحالية قد تواجه صعوبة في هذا النوع من التحكم المعرفي عندما تصبح المهام أكثر تعقيدًا.

الخاتمة

أظهرت الدراسة أن النماذج الذكاء الاصطناعي، رغم قدرتها على محاكاة بعض السلوكيات البشرية، تواجه تحديات كبيرة في الحفاظ على التركيز والانتباه في المهام المعقدة. بينما يتمتع الدماغ البشري بقدرة استثنائية على معالجة مثل هذه التحديات، لا تزال أنظمة الذكاء الاصطناعي محدودة في هذا الجانب. هذا يذكرنا بأن حتى أكثر الأنظمة تقدمًا لديها نقاط ضعف، خصوصًا عندما تتطلب المهام مقاومة الانحرافات والتركيز على سلاسل معلومات طويلة.