متابعة – أمل علوي
أصدرت شركة سامسونج بحثًا جديدًا يسلط الضوء على كيفية تفوق نموذج صغير يُعرف باسم “النموذج التكراري الصغير” (TRM) على نماذج اللغة الكبيرة (LLMs) في مجالات التفكير المعقد. تأتي هذه الدراسة في وقت تسعى فيه الشركات الكبرى لتطوير نماذج أكبر وأكثر تعقيدًا، لكن سامسونج تقدم بديلاً فعالًا وأكثر كفاءة.
الابتكار في نموذج TRM
بدلاً من الاستناد إلى نماذج ضخمة، يستخدم نموذج TRM شبكة صغيرة تحتوي على 7 ملايين معلمة، وهو ما يعادل أقل من 0.01% من حجم النماذج الرائدة. وقد حقق هذا النموذج نتائج متقدمة في اختبارات الذكاء المعقدة مثل اختبار ARC-AGI، مما يتحدى الفرضية السائدة بأن الحجم هو المفتاح الوحيد لتعزيز قدرات نماذج الذكاء الاصطناعي.
تحديات نماذج اللغة الكبيرة
على الرغم من النجاح الذي حققته نماذج اللغة الكبيرة في توليد النصوص البشرية، إلا أن قدرتها على إجراء تفكير معقد ومتعدد الخطوات قد تكون غير موثوقة. حيث يمكن أن يتسبب خطأ واحد في بداية العملية في تعريض الحل الكامل للخطر، مما يؤدي إلى نتائج غير صحيحة.
تحسينات نموذج TRM
بدلاً من استخدام شبكتين كما في نموذج HRM (النموذج الهرمي للتفكير)، يعتمد TRM على شبكة واحدة صغيرة تقوم بتحسين كل من “التفكير” الداخلي و”الإجابة” المقترحة بشكل تكراري. يتم إدخال السؤال وتخمين أولي للإجابة، ويقوم النموذج بتكرار عملية تحسين التفكير بناءً على هذه المدخلات، مما يمكّنه من تصحيح الأخطاء بشكل فعال.
نتائج مذهلة
أظهرت نتائج TRM تفوقًا ملحوظًا على نماذج سابقة. على سبيل المثال، حقق TRM دقة اختبار تصل إلى 87.4% في اختبار Sudoku-Extreme، متجاوزًا نموذج HRM الذي حقق 55%. كما حقق نتائج رائعة في اختبار ARC-AGI، حيث سجل دقة 44.6% في ARC-AGI-1 و7.8% في ARC-AGI-2، متفوقًا على العديد من أكبر النماذج العالمية.
توقعات المستقبل
تقدم أبحاث سامسونج حججًا قوية ضد الاتجاه الحالي الذي يركز على توسيع نماذج الذكاء الاصطناعي. إذ تُظهر أن التصميمات التي تسمح بالتفكير التكراري والتصحيح الذاتي يمكن أن تحل مشكلات معقدة للغاية باستخدام جزء بسيط من الموارد الحاسوبية.
هذا المحتوى تم باستخدام أدوات الذكاء الاصطناعي.