متابعة – أمل علوي
تتحسن أدوات ترميز الذكاء الاصطناعي بسرعة. إذا كنت لا تعمل في التعليمات البرمجية ، فقد يكون من الصعب ملاحظة مقدار ما تتغير ، ولكن GPT-5 و Gemini 2.5 جعلوا مجموعة جديدة تمامًا من الحيل المطورين الممكنة لأتمتة ، وفي الأسبوع الماضي ، قام Sonnet 2.4 بذلك مرة أخرى.
في الوقت نفسه ، تتقدم مهارات أخرى ببطء أكثر. إذا كنت تستخدم الذكاء الاصطناعي لكتابة رسائل البريد الإلكتروني ، فمن المحتمل أن تحصل على نفس القيمة التي قمت بها قبل عام. حتى عندما يتحسن النموذج ، لا يستفيد المنتج دائمًا – خاصةً عندما يكون المنتج عبارة عن chatbot يقوم بعمل عشر وظائف مختلفة في نفس الوقت. لا تزال الذكاء الاصطناعى تحرز تقدماً ، لكنها ليست موزعة بالتساوي كما كانت.
الفرق قيد التقدم أبسط مما يبدو. تستفيد تطبيقات الترميز من مليارات الاختبارات القابلة للقياس بسهولة ، والتي يمكن أن تدربها على إنتاج رمز عملي. هذا هو التعلم التعزيز (RL) ، يمكن القول إن أكبر سائق للتقدم في الذكاء الاصطناعي خلال الأشهر الستة الماضية ويصبح أكثر تعقيدًا طوال الوقت. يمكنك القيام بالتعلم التعزيز مع طلاب الصف البشري ، ولكنه يعمل بشكل أفضل إذا كان هناك مقياس واضح للمرور ، حتى تتمكن من تكراره مليارات المرات دون الاضطرار إلى التوقف عن المدخلات البشرية.
نظرًا لأن الصناعة تعتمد بشكل متزايد على التعلم التعزيز لتحسين المنتجات ، فإننا نرى فرقًا حقيقيًا بين القدرات التي يمكن تصنيفها تلقائيًا وتلك التي لا تستطيع ذلك. تتحسن مهارات RL الصديقة مثل تثبيت الأخطاء والرياضيات التنافسية ، في حين أن المهارات مثل الكتابة تحرز تقدمًا تدريجيًا فقط.
باختصار ، هناك فجوة في التعزيز – وأصبحت واحدة من أهم العوامل لما يمكن أن تفعله أنظمة الذكاء الاصطناعى وما لا يمكن أن تفعله.
في بعض النواحي ، يعد تطوير البرمجيات هو الموضوع المثالي للتعلم التعزيز. حتى قبل الذكاء الاصطناعى ، كان هناك انضباط فرعي كامل مكرس لاختبار كيفية ظهور البرامج تحت الضغط-إلى حد كبير لأن المطورين يحتاجون للتأكد من أن رمزهم لن ينكسر قبل نشره. لذا ، حتى أن الكود الأكثر أناقة لا يزال يتعين على اختبار الوحدة واختبار التكامل واختبار الأمان وما إلى ذلك. يستخدم المطورون البشريون هذه الاختبارات بشكل روتيني للتحقق من صحة التعليمات البرمجية الخاصة بهم ، وكما أخبرني المدير الأول في Google لأدوات DEV مؤخرًا ، فهي مفيدة تمامًا للتحقق من الشفرة التي تم إنشاؤها بواسطة الذكاء الاصطناعى. أكثر من ذلك ، فهي مفيدة للتعلم التعزيز ، لأنها بالفعل منظمة وقابلة للتكرار على نطاق واسع.
لا توجد طريقة سهلة للتحقق من صحة بريد إلكتروني مكتوب جيدًا أو استجابة جيدة للدردشة ؛ هذه المهارات ذاتية بطبيعتها وأصعب لقياسها على نطاق واسع. ولكن لا تندرج كل مهمة بدقة في فئات “من السهل اختبار” أو “يصعب اختبارها”. ليس لدينا مجموعة اختبار خارج الصندوق للتقارير المالية الفصلية أو العلوم الاكتوارية ، ولكن من المحتمل أن تكون شركة بدء تشغيل المحاسبة جيدة الرأس قد تبني واحدة من نقطة الصفر. ستعمل بعض مجموعات الاختبار بشكل أفضل من غيرها ، بالطبع ، وستكون بعض الشركات أكثر ذكاءً حول كيفية التعامل مع المشكلة. لكن قابلية اختبار العملية الأساسية ستكون العامل الحاسم في ما إذا كان يمكن تحويل العملية الأساسية إلى منتج وظيفي بدلاً من مجرد عرض تجريبي مثير.
حدث TechCrunch
سان فرانسيسكو
|
27-29 أكتوبر ، 2025
تتحول بعض العمليات إلى أن تكون أكثر قابلية للاختبار مما تعتقد. إذا سألتني الأسبوع الماضي ، كنت سأضع الفيديو الذي تم إنشاؤه بواسطة الذكاء الاصطناعى في فئة “HARD TO TOTEST” ، لكن التقدم الهائل الذي أحرزه نموذج Sora 2 الجديد من Openai قد لا يكون صعبًا كما يبدو. في سورا 2 ، لم تعد الأشياء تظهر وتختفي من العدم. وجوه تحمل شكلها ، تبدو وكأنها شخص معين بدلاً من مجرد مجموعة من الميزات. Sora 2 لقطات تحترم قوانين الفيزياء في كليهما بديهي و دقيق طرق. أظن أنه إذا نظرت خلف الستار ، فستجد نظام تعلم تعزيز قوي لكل من هذه الصفات. وضعت معا ، أنها تحدث فرقا بين الواقعية والهلوسة الترفيه.
لتوضيح ذلك ، هذه ليست قاعدة صعبة وسريعة للذكاء الاصطناعي. إنه نتيجة لتعلم تعزيز الدور المركزي في تطوير الذكاء الاصطناعي ، والذي يمكن أن يتغير بسهولة مع تطور النماذج. ولكن طالما أن RL هي الأداة الأساسية لجلب منتجات الذكاء الاصطناعى إلى السوق ، فإن فجوة التعزيز ستزداد أكبر فقط – مع وجود آثار خطيرة على كل من الشركات الناشئة والاقتصاد بشكل عام. إذا انتهت عملية ما على الجانب الأيمن من فجوة التعزيز ، فمن المحتمل أن تنجح الشركات الناشئة في أتمتة – وقد ينتهي أي شخص يقوم بهذا العمل الآن بالبحث عن مهنة جديدة. على سبيل المثال ، فإن السؤال حول خدمات الرعاية الصحية RL ، على سبيل المثال ، لها آثار هائلة على شكل الاقتصاد على مدار العشرين عامًا القادمة. وإذا كانت مفاجآت مثل Sora 2 أي إشارة ، فقد لا نضطر إلى الانتظار لفترة طويلة للحصول على إجابة.
هذا المحتوي تم باستخدام أدوات الذكاء الإصطناعي