في خطوة بارزة في عالم الذكاء الاصطناعي، حققت شركة ديب سيك الصينية نجاحًا لافتًا من خلال نموذجها القوي R1. هذا النموذج الذي أثار اضطرابًا في سوق الأسهم الأمريكية عند إطلاقه في يناير، لم يعتمد في نجاحه على تدريبه على مخرجات منافسيه كما أكدت الشركة في مستندات نشرت مع النسخة المحكّمة من النموذج في مجلة Nature.
مواصفات نموذج R1
تم تصميم نموذج R1 ليكون متميزًا في مهام “التفكير” مثل الرياضيات والبرمجة، ويعتبر منافسًا أقل تكلفة للأدوات المطورة من قبل شركات التكنولوجيا الأمريكية. كونه نموذجًا “مفتوح الوزن”، يمكن لأي شخص تنزيله، ويُعد الأكثر شعبية في مجتمع الذكاء الاصطناعي على منصة Hugging Face، حيث تم تنزيله 10.9 مليون مرة.
النموذج هو تحديث لنسخة سابقة نُشرت في يناير ووصفت كيف قامت ديب سيك بتعزيز النموذج القياسي للتعامل مع مهام التفكير. وكشفت المواد التكميلية لأول مرة عن تكلفة تدريب R1، والتي بلغت 294,000 دولار أمريكي، بالإضافة إلى حوالي 6 ملايين دولار أُنفقت لإنشاء النموذج الأساسي الذي بُني عليه R1.
عملية المراجعة العلمية
يُعتبر R1 أول نموذج لغوي كبير يخضع لعملية مراجعة الأقران، وهو ما يعتبره الكثيرون سابقة مرحب بها. إذ أن هذا النوع من الشفافية يمكن أن يساعد في تقييم المخاطر التي قد تشكلها هذه الأنظمة. ردًا على تعليقات المراجعين، قللت ديب سيك من التشخيص البشري في أوصافها وأضافت توضيحات للتفاصيل التقنية، بما في ذلك أنواع البيانات التي تم تدريب النموذج عليها وسلامته.
تقنيات التدريب المبتكرة
تُعد أحد الابتكارات الرئيسية لديب سيك هو استخدام نهج التعلم المعزز النقي لإنشاء R1. تم مكافأة النموذج للوصول إلى الإجابات الصحيحة، بدلاً من تعليمه اتباع الأمثلة البشرية. ولتعزيز الكفاءة، قام النموذج بتقييم محاولاته باستخدام تقديرات بدلاً من استخدام خوارزمية منفصلة، وهي تقنية تُعرف بتحسين سياسة المجموعة النسبية.
هذا النهج قد ألهم الكثير من الباحثين في مجال الذكاء الاصطناعي، ويُعتقد أن معظم الأبحاث التي أُجريت في عام 2025 المتعلقة بالتعلم المعزز في النماذج اللغوية الكبيرة قد استلهمت من R1.
الخاتمة
في النهاية، يظل نموذج R1 منافسًا قويًا على الساحة البحثية. رغم أنه لم يكن الأول في الدقة في تحدي المهام العلمية مثل تحليل البيانات وتصورها، إلا أنه يُعتبر من أفضل النماذج من حيث التوازن بين الأداء والتكلفة. يسعى الباحثون الآن لتطبيق الأساليب المستخدمة في إنشاء R1 لتحسين قدرات النماذج الحالية في التفكير المنطقي وتوسيعها إلى مجالات أخرى تتجاوز الرياضيات والبرمجة، مما يبرز أن R1 قد أشعل ثورة حقيقية في هذا المجال.


