EFF ، النقابات ترفع دعوى قضائية ضد إدارة ترامب بسبب المراقبة الجماعية المزعومة لوسائل التواصل الاجتماعي للمقيمين القانونيين
EFF ، النقابات ترفع دعوى قضائية ضد إدارة ترامب بسبب المراقبة الجماعية المزعومة لوسائل التواصل الاجتماعي للمقيمين القانونيين
الخميس - 16 أكتوبر - 2025
لا تزال تقنية Lilium، التي بدأت تشغيل الطائرات الكهربائية البائدة، موجودة في آرتشر
لا تزال تقنية Lilium، التي بدأت تشغيل الطائرات الكهربائية البائدة، موجودة في آرتشر
الجمعة - 17 أكتوبر - 2025

متابعة – أمل علوي

لمدة أسبوع واحد هذا الصيف، ارتدت تايلور ورفيقتها في الغرفة كاميرات GoPro مربوطة على جباههما أثناء الرسم والنحت والقيام بالأعمال المنزلية. لقد كانوا يقومون بتدريب نموذج رؤية يعمل بالذكاء الاصطناعي، ويقومون بمزامنة لقطاتهم بعناية حتى يتمكن النظام من الحصول على زوايا متعددة لنفس السلوك. لقد كان عملاً صعبًا من نواحٍ عديدة، لكنهم حصلوا على أجر جيد مقابل ذلك، وسمح ذلك لتايلور بقضاء معظم يومها في صنع الفن.

قالت لي: “استيقظنا، وقمنا بروتيننا المعتاد، ثم ربطنا الكاميرات على رؤوسنا وقمنا بمزامنة الأوقات معًا”. “ثم نقوم بإعداد وجبة الإفطار وتنظيف الأطباق. ثم نذهب في طرق منفصلة ونعمل على الفن.”

تم تعيينهم لإنتاج خمس ساعات من اللقطات المتزامنة كل يوم، لكن تايلور سرعان ما أدركت أنها بحاجة إلى تخصيص سبع ساعات يوميًا للعمل، لترك وقت كافٍ لفترات الراحة والتعافي الجسدي.

قالت: “سيسبب لك الصداع”. “قم بخلعه ولا يوجد سوى مربع أحمر على جبهتك.”

كانت تايلور، التي طلبت عدم الكشف عن اسمها الأخير، تعمل كموظفة مستقلة للبيانات في شركة Turing، وهي شركة ذكاء اصطناعي ربطتها بـ TechCrunch. لم يكن هدف تورينج هو تعليم الذكاء الاصطناعي كيفية رسم اللوحات الزيتية، بل اكتساب المزيد من المهارات التجريدية حول حل المشكلات المتسلسل والتفكير البصري. على عكس نموذج اللغة الكبير، سيتم تدريب نموذج رؤية تورينج بالكامل على الفيديو، وسيتم جمع معظمه مباشرة بواسطة تورينج.

إلى جانب فنانين مثل تايلور، يتعاقد تورينج مع الطهاة وعمال البناء والكهربائيين – أي شخص يعمل بأيديهم. صرح سودارشان سيفارامان، كبير مسؤولي AGI في Turing، لـ TechCrunch أن التجميع اليدوي هو الطريقة الوحيدة للحصول على مجموعة بيانات متنوعة بما فيه الكفاية.

وقال سيفارامان لـ TechCrunch: “إننا نقوم بذلك من أجل العديد من أنواع العمل المختلفة، بحيث يكون لدينا مجموعة متنوعة من البيانات في مرحلة ما قبل التدريب”. “بعد أن نلتقط كل هذه المعلومات، ستكون النماذج قادرة على فهم كيفية تنفيذ مهمة معينة.”

حدث تك كرانش

سان فرانسيسكو
|
27-29 أكتوبر 2025

يعد عمل تورينج على نماذج الرؤية جزءًا من تحول متزايد في كيفية تعامل شركات الذكاء الاصطناعي مع البيانات. في حين كان يتم استخراج مجموعات التدريب بحرية من الويب أو جمعها من المعلقين ذوي الأجور المنخفضة، فإن الشركات تدفع الآن مبالغ كبيرة مقابل البيانات المنسقة بعناية.

مع وجود القوة الخام للذكاء الاصطناعي بالفعل، تتطلع الشركات إلى ملكية بيانات التدريب كميزة تنافسية. وبدلاً من إسناد المهمة إلى المقاولين، فإنهم غالبًا ما يتولون العمل بأنفسهم.

شركة البريد الإلكتروني فيكسر، الذي يستخدم نماذج الذكاء الاصطناعي لفرز رسائل البريد الإلكتروني ومسودة الردود، هو أحد الأمثلة.

بعد بعض التجارب المبكرة، اكتشف المؤسس ريتشارد هولينجسورث أن أفضل نهج هو استخدام مجموعة من النماذج الصغيرة مع بيانات التدريب المركزة بإحكام. على عكس تورينج، يبني فايكسر نموذجًا أساسيًا لشخص آخر، لكن الرؤية الأساسية هي نفسها.

قال لي هولينجسورث: “لقد أدركنا أن جودة البيانات، وليس الكمية، هي ما يحدد الأداء حقًا”.

ومن الناحية العملية، كان ذلك يعني بعض الاختيارات غير التقليدية للموظفين. يقول هولينجسورث: في الأيام الأولى، كان عدد المهندسين والمديرين في شركة Fyxer يفوق أحيانًا عدد المساعدين التنفيذيين اللازمين لتدريب النموذج بنسبة أربعة إلى واحد.

وقال لـ TechCrunch: “لقد استخدمنا الكثير من المساعدين التنفيذيين ذوي الخبرة، لأننا كنا بحاجة إلى التدريب على أساسيات ما إذا كان ينبغي الرد على البريد الإلكتروني أم لا”. “إنها مشكلة موجهة نحو الناس للغاية. العثور على أشخاص رائعين أمر صعب للغاية. ”

لم تتباطأ وتيرة جمع البيانات أبدًا، ولكن مع مرور الوقت، أصبح هولينجسورث أكثر اهتمامًا بمجموعات البيانات، مفضلاً مجموعات أصغر من مجموعات البيانات الأكثر تنظيمًا عندما يحين وقت ما بعد التدريب. وعلى حد تعبيره، “إن جودة البيانات، وليس الكمية، هي ما يحدد الأداء حقًا”.

وهذا صحيح بشكل خاص عند استخدام البيانات الاصطناعية، مما يؤدي إلى تضخيم نطاق سيناريوهات التدريب المحتملة وتأثير أي عيوب في مجموعة البيانات الأصلية. ومن ناحية الرؤية، يقدر تورينج أن 75% إلى 80% من بياناته هي بيانات اصطناعية، مستمدة من مقاطع فيديو GoPro الأصلية. ولكن هذا يزيد من أهمية الحفاظ على جودة مجموعة البيانات الأصلية قدر الإمكان.

يقول سيفارامان: “إذا لم تكن بيانات ما قبل التدريب في حد ذاتها ذات نوعية جيدة، فإن كل ما تفعله بالبيانات الاصطناعية لن يكون ذا نوعية جيدة أيضًا”.

وبعيدًا عن المخاوف المتعلقة بالجودة، هناك منطق تنافسي قوي وراء الاحتفاظ بجمع البيانات داخل الشركة. بالنسبة لـ Fyxer، يعد العمل الجاد في جمع البيانات أحد أفضل الخنادق التي تمتلكها الشركة في مواجهة المنافسة. كما يرى هولينجسورث، يمكن لأي شخص بناء نموذج مفتوح المصدر في منتجه – ولكن لا يمكن للجميع العثور على شروحات خبراء لتدريبه على منتج عملي.

وقال لـ TechCrunch: “نعتقد أن أفضل طريقة للقيام بذلك هي من خلال البيانات، ومن خلال بناء نماذج مخصصة، من خلال تدريب عالي الجودة على البيانات بقيادة الإنسان”.

تصحيح: نسخة سابقة من هذه القطعة أشارت إلى تورينج باسم غير صحيح. تأسف TechCrunch لهذا الخطأ.


هذا المحتوي تم باستخدام أدوات الذكاء الإصطناعي

مشاركة الخبر
أخبار مشابهة
الأحد - 23 نوفمبر - 2025
استجابة للطلب الهائل.. بروكفيلد تعلن عن صندوق بقيمة 10 مليارات دولار لتمويل البنية التحتية للذكاء الاصطناعي موجة استثمارية جديدة في العمود الفقري للتقنية الحديثة