سقوط الروبوت الذكي من روسيا بعد ثوانٍ من الكشف عنه
سقوط الروبوت الذكي من روسيا بعد ثوانٍ من الكشف عنه
الخميس - 13 نوفمبر - 2025
هل تفقد وول ستريت الثقة في الذكاء الاصطناعي؟
هل تفقد وول ستريت الثقة في الذكاء الاصطناعي؟
الخميس - 13 نوفمبر - 2025


متابعة – أمل علوي

 

أطلق العملاق الصيني بايدو أحدث طرازات الذكاء الاصطناعي المتعدد الأنماط، ERNIE-4.5-VL-28B-A3B-Thinking، الذي حقق أداءً متميزًا في عدة اختبارات مقارنةً بنماذج مثل GPT-5 وGemini. تم تصميم نموذج ERNIE لملء الفجوات في البيانات المؤسسية التي غالبًا ما يتم تجاهلها من قبل النماذج التي تركز على النصوص، مما يمكّن الشركات من الاستفادة من رؤى قيمة مخزنة في الرسومات الهندسية، ومقاطع الفيديو الخاصة بالعمليات، والماسحات الطبية، ولوحات معلومات اللوجستيات.

الميزات الفنية لنموذج ERNIE

يُعتبر النموذج ERNIE خفيف الوزن، حيث يتم تنشيط 3 مليار معلمة فقط أثناء التشغيل، مما يساعد في تقليل تكاليف الاستدلال العالية التي تعيق مشاريع الذكاء الاصطناعي. مع هذه الكفاءة، يسعى بايدو إلى تعزيز اعتمادية النموذج، مما يفتح الأبواب أمام “عوامل متعددة الأنماط” قادرة على التفكير والتصرف، وليس فقط الإدراك.

أظهرت نتائج معيارية أن ERNIE-4.5 يتفوق على المنافسين في اختبارات محددة، مثل:

MathVista: ERNIE (82.5) مقابل Gemini (82.3) وGPT (81.3)
ChartQA: ERNIE (87.1) مقابل Gemini (76.3) وGPT (78.2)
VLMs Are Blind: ERNIE (77.3) مقابل Gemini (76.5) وGPT (69.6)
الانتقال من الإدراك إلى الأتمتة

تتمحور التحديات الرئيسية في ذوات الذكاء الاصطناعي في الشركات حول التحول من الإدراك (مثل “ما هذا؟”) إلى الأتمتة (مثل “ماذا الآن؟”). يدعي ERNIE 4.5 أنه يعالج هذه القضية من خلال دمج المعرفة البصرية مع استخدام الأدوات، مما يمكّن الشركات من الاستفادة من هذا الذكاء الاصطناعي في سياقات عملية حقيقية.

إمكانيات إدارة البيانات المرئية

يستهدف نموذج ERNIE أيضًا الأرشيفات الفيديوية للشركات بما في ذلك مقاطع تدريبية واجتماعات ولقطات أمنية. يمكنه استخراج كل الترجمة المعروضة على الشاشة وربطها بالتوقيتات الدقيقة، مما يجعل مكتبات الفيديو الضخمة قابلة للبحث بشكل فعال.

يحتاج النموذج إلى بنية تحتية متطورة، حيث تتطلب عمليات النشر بطاقة GPU بسعة 80GB على الأقل. ومع ذلك، يقدم بايدو دليل نشر واضح للعديد من الطرق، بما في ذلك نماذج المحولات وvLLM وFastDeploy.

استنتاجات السوق

يتجه السوق بشكل متزايد نحو الذكاء الاصطناعي متعدد الأنماط القادر على “الرؤية، والقراءة، والتصرف” في سياقات أعمال محددة، مع نتائج معيارية تشير إلى نجاحه في ذلك. أشار العديد من الخبراء إلى أنه يجب تحديد المهام ذات القيمة العالية المتعلقة بتفكير البيانات البصرية في العمليات الخاصة بالشركات، ودراستها بعناية أمام التكاليف المرتفعة للبنية التحتية والإدارة.

هذا المحتوى تم باستخدام أدوات الذكاء الاصطناعي.



مشاركة الخبر
أخبار مشابهة