يعتقد Deepmind أن نموذج Genie 3 الجديد يقدم حجرًا خطوة نحو Agi

متابعة – أمل علوي

كشفت Google Deepmind عن Genie 3 ، وهو أحدث نموذج له في العالم الأساس الذي يمكن استخدامه لتدريب وكلاء الذكاء الاصطناعي للأغراض العامة ، وهي قدرة يقول مختبر الذكاء الاصطناعى على النزعة الحاسمة على الطريق إلى “الذكاء العام الاصطناعي” أو الذكاء الشبيه بالإنسان.

وقال شلوملي فروتشتر ، مدير الأبحاث في DeepMind خلال مؤتمر صحفي: “Genie 3 هو أول نموذج عالمي تفاعلي للأغراض العامة في الوقت الفعلي”. “إنها تتجاوز نماذج العالم الضيقة التي كانت موجودة من قبل. إنها ليست خاصة بأي بيئة معينة. يمكن أن تولد كل من عوالم واقعية وخيالية ، وكل شيء بينهما”.

لا يزال في معاينة البحث وليس متاحًا للجمهور ، يعتمد Genie 3 على كل من سابقتها Genie 2 (التي يمكن أن تولد بيئات جديدة للعوامل) وأحدث نموذج توليد الفيديو في DeepMind VEO 3 (الذي يقال إنه له فهم عميق للفيزياء).

ائتمانات الصورة:Google DeepMind

من خلال موجه نص بسيط ، يمكن لـ Genie 3 إنشاء عدة دقائق من البيئات ثلاثية الأبعاد التفاعلية بدقة 720 بكسل عند 24 إطارًا في الثانية – وهي قفزة كبيرة من 10 إلى 20 ثانية التي يمكن أن تنتجها Genie 2. يحتوي النموذج أيضًا على “أحداث عالمية قابلة للسرعة” ، أو القدرة على استخدام موجه لتغيير العالم الذي تم إنشاؤه.

ولعل الأهم من ذلك ، تظل عمليات محاكاة Genie 3 متسقة جسديًا مع مرور الوقت لأن النموذج يمكن أن يتذكر ما تم إنشاؤه مسبقًا – وهي القدرة التي تقول DeepMind أن الباحثين لم يبرمموا بشكل صريح في النموذج.

وقال Fruchter إنه على الرغم من أن Genie 3 له آثار على التجارب التعليمية أو الألعاب أو النماذج الأولية للمفاهيم الإبداعية ، فإن فتحه الحقيقي سيظهر في وكلاء التدريب على المهام للأغراض العامة ، والتي قال إنها ضرورية للوصول إلى AGI.

وقال جاك باركر ، وهو عالم أبحاث في فريق DeepMind المفتوح ، خلال مؤتمر الإحاطة: “نعتقد أن النماذج العالمية هي مفتاح الطريق إلى AGI ، وتحديداً للعوامل المجسدة ، حيث يمثل محاكاة سيناريوهات العالم الحقيقي تحديًا بشكل خاص”.

حدث TechCrunch

سان فرانسيسكو
|
27-29 أكتوبر ، 2025

من المفترض أن يكون Genie 3 مصممًا لحل عنق الزجاجة. مثل Veo ، لا يعتمد على محرك الفيزياء المرمز ؛ بدلاً من ذلك ، يقول Deepmind ، يعلم النموذج نفسه كيف يعمل العالم – كيف تتحرك الأشياء وتساقطها وتفاعلها – من خلال تذكر ما ولدته وتفكيره خلال آفاق طويلة.

وقال فروتشتر لـ TechCrunch في مقابلة: “النموذج يعتبر تلقائيًا ، مما يعني أنه يولد إطارًا واحدًا في وقت واحد”. “يجب أن ننظر إلى الوراء إلى ما تم إنشاؤه من قبل لتقرير ما سيحدث بعد ذلك. هذا جزء رئيسي من الهندسة المعمارية.”

وتقول الشركة إن هذه الذاكرة تضفي على الاتساق في عوالم جيني 3 المحاكاة ، والتي بدورها تسمح لها بتطوير فهم الفيزياء ، على غرار كيف يفهم البشر أن الزجاج على حافة الطاولة على وشك السقوط ، أو يجب عليهم البط لتجنب كائن السقوط.

والجدير بالذكر أن DeepMind يقول إن النموذج لديه أيضًا القدرة على دفع وكلاء الذكاء الاصطناعي إلى حدودهم – مما يجبرهم على التعلم من تجربتهم الخاصة ، على غرار كيفية تعلم البشر في العالم الحقيقي.

على سبيل المثال ، شاركت DeepMind اختبارها لـ Genie 3 مع إصدار حديث من الخبير العام وكيل متعدد العالم قابل للتطوير (SIMA)، توجيهه لمتابعة مجموعة من الأهداف. في إعداد المستودعات ، طلبوا من الوكيل أداء مهام مثل “اقترب من ضوّاع القمامة الخضراء المشرقة” أو “المشي إلى الرافعة الشوكية الحمراء المعبأة”.

وقال باركر حامل: “في جميع الحالات الثلاث ، قادر على تحقيق الهدف”. “إنه يتلقى فقط الإجراءات من الوكيل. لذا فإن الوكيل يأخذ الهدف ، ويرى أن العالم محاكاة حوله ، ثم يتخذ الإجراءات في العالم. يحاكي Genie 3 إلى الأمام ، وحقيقة أنه قادر على تحقيق ذلك بسبب أن Genie 3 لا يزال ثابتًا.”

ومع ذلك ، فإن Genie 3 له حدوده. على سبيل المثال ، في حين يزعم الباحثون أنها يمكن أن تفهم الفيزياء ، فإن العرض التوضيحي الذي يظهر متزلجًا يتجول في الجبل لم يعكس كيف سيتحرك الثلج فيما يتعلق بالمتزلج.

بالإضافة إلى ذلك ، فإن نطاق الإجراءات التي يمكن أن يتخذها الوكيل محدودة. على سبيل المثال ، تتيح الأحداث العالمية القابلة للسرعة مجموعة واسعة من التدخلات البيئية ، لكنها لا تتم بالضرورة من قبل الوكيل نفسه. ولا يزال من الصعب تصميم التفاعلات المعقدة بدقة بين عوامل مستقلة متعددة في بيئة مشتركة.

يمكن لـ Genie 3 أيضًا دعم بضع دقائق فقط من التفاعل المستمر ، عندما تكون ساعات العمل ضرورية للتدريب المناسب.

ومع ذلك ، يقدم النموذج خطوة مقنعة إلى الأمام في وكلاء التدريس لتجاوز التفاعل مع المدخلات ، والسماح لهم بالتخطيط والاستكشاف والبحث عن عدم اليقين والتحسين من خلال التجربة والخطأ-نوع التعلم المجسد ذاتيًا ، كما يقول الكثيرون أنه مفتاح للانتقال نحو الذكاء العام.

وقال باركر حامل ، في إشارة إلى اللحظة الأسطورية في لعبة GO المثيرة للاشمئزاز ، “لم يكن لدينا بالفعل خطوة 37 لحظة لوكلاء مجسدين حتى الآن ، حيث يمكنهم في الواقع اتخاذ إجراءات جديدة في العالم الحقيقي” ، في إشارة إلى اللحظة الأسطورية في لعبة Go 2016 بين عميل Deepmind من AI Ai لاكتشاف Ai Beash “.

“لكن الآن ، يمكننا أن ندخل في حقبة جديدة” ، قال.

هذا المحتوي تم باستخدام أدوات الذكاء الإصطناعي