تخطى إلى المحتوى

نموذج سامسونج الصغير يتفوق على النماذج اللغوية الضخمة في الذكاء الاصطناعي

في سباق التفوق في مجال الذكاء الاصطناعي، غالبًا ما كان يُعتقد أن الحجم الأكبر للنماذج هو الأفضل. لكن بحثًا جديدًا من باحث في الذكاء الاصطناعي من سامسونج يكشف عن أن شبكة صغيرة يمكنها التغلب على النماذج اللغوية الضخمة في التفكير المعقد. يُظهر هذا البحث أن نموذجًا صغيرًا، يُسمى نموذج سامسونج التكراري الصغير (TRM)، يمكنه تحقيق نتائج متفوقة باستخدام موارد أقل بكثير.

النماذج اللغوية الضخمة وتحدياتها

النماذج اللغوية الضخمة (LLMs) أظهرت قدرة مذهلة في إنتاج نصوص شبيهة بالنصوص البشرية. لكنها تواجه صعوبة في تنفيذ التفكير المعقد والمتعدد الخطوات. حيث أن هذه النماذج تولد الإجابات بشكل تدريجي، مما يعني أن أي خطأ في البداية يمكن أن يؤدي إلى نتائج غير صحيحة في النهاية.

تقنيات مثل سلسلة الأفكار (Chain-of-Thought) ظهرت كمحاولة لحل هذه المشكلة. لكن هذه التقنيات تتطلب موارد حسابية كبيرة وقد لا تتوفر دائمًا بيانات كافية وعالية الجودة لدعمها.

نموذج سامسونج التكراري الصغير (TRM)

بنى عمل سامسونج على نموذج حديث يُعرف بنموذج التفكير الهرمي (HRM). لكن بدلاً من استخدام شبكتين كما في HRM، يعتمد TRM على شبكة واحدة صغيرة تعمل على تحسين التفكير الداخلي والإجابة المقترحة بشكل تكراري.

يبدأ النموذج بتلقي السؤال والتخمين الأولي للإجابة وميزة تفكير كامنة. ثم يمر النموذج عبر خطوات لتحسين التفكير استنادًا إلى المدخلات الثلاثة. بعد ذلك، يستخدم التفكير المحسن لتحديث التنبؤ بالإجابة النهائية. هذه العملية يمكن تكرارها حتى 16 مرة، مما يسمح للنموذج بتصحيح أخطائه بشكل تدريجي وفعال.

التفوق على النماذج الضخمة باستخدام موارد أقل

حققت TRM نتائج مذهلة على مختلف مجموعات البيانات. على مجموعة بيانات سودوكو، حقق دقة اختبار بلغت 87.4%، مقارنة بـ 55% لنموذج HRM. كما حقق نتائج متفوقة في اختبارات الممرات المتاهية وقياس الذكاء السائل في الذكاء الاصطناعي.

يتميز TRM بآلية تدريب محسنة تُسمى ACT، والتي تحدد متى قام النموذج بتحسين الإجابة بما فيه الكفاية ويمكنه الانتقال إلى عينة بيانات جديدة. هذه التغييرات جعلت عملية التدريب أكثر كفاءة بدون التأثير على الأداء العام.

الخاتمة

يُظهر بحث سامسونج أن تصميم النماذج التي يمكنها التفكير التكراري والتصحيح الذاتي يتيح حل المشكلات المعقدة باستخدام موارد حسابية أقل بكثير. هذا الاكتشاف يمثل تحديًا للاتجاه الحالي الذي يركز على توسيع حجم النماذج. من خلال التفكير التكراري، يمكن للنماذج الصغيرة تحقيق نتائج مدهشة، مما يفتح الباب أمام مستقبل مستدام وأكثر كفاءة في عالم الذكاء الاصطناعي.