يقال إن OpenAI قامت بنسخ مليون ساعة من مقاطع فيديو YouTube لتدريب GPT-4
وبحسب ما ورد قامت OpenAI بنسخ أكثر من مليون ساعة من مقاطع الفيديو على YouTube لتدريب GPT-4، وفقًا لما ذكرته اوقات نيويورك في.يوم السبت. يأتي التقرير بعد أيام فقط من تصريح الرئيس التنفيذي لموقع YouTube، نيل موهان، بشأن النسخ فيديوهات يوتيوب للتدريب على الذكاء الاصطناعي سيكون “انتهاك واضحمن سياساتها في مقابلة مع بلومبرج.
“عندما يقوم منشئ المحتوى بتحميل أعماله الشاقة إلى منصتنا، تكون لديه توقعات معينة. وقال موهان في مقابلة مع بلومبرج: “أحد هذه التوقعات هو أنه سيتم الالتزام بشروط الخدمات”. الأسبوع الماضي. “لكنه لا يسمح بتنزيل أشياء مثل النصوص أو مقاطع الفيديو.”
ويزعم تقرير صحيفة نيويورك تايمز أن أعضاء فريق OpenAI، بما في ذلك الرئيس جريج بروكمان، ساعدوا شخصيًا في جمع مقاطع الفيديو على يوتيوب، وفقًا للمصادر. يوضح المقال كيف تواجه OpenAI والعديد من شركات التكنولوجيا صعوبة في جمع بيانات كافية لتدريب نماذج الذكاء الاصطناعي الضخمة. ويُزعم أن OpenAI استخدمت Whisper، وهو برنامج نسخ الذكاء الاصطناعي الخاص بها، لجمع المزيد من البيانات لتدريب GPT-4، وهو أحدث وأكبر نموذج يقوم عليه ChatGPT.
ولم يستجب OpenAI وGoogle على الفور لطلبات Gizmodo للتعليق.
يمكن أن يكون لتقرير نيويورك تايمز آثار هائلة على OpenAI ومعركة Google المستمرة في طليعة تطوير الذكاء الاصطناعي التوليدي. من غير المرجح أن تلتزم Google الصمت إذا كانت OpenAI تستخدم محتواها لجعل ChatGPT أكبر. ومع ذلك، لم تقدم الشركة مثل هذه الادعاءات حتى الآن. في تصريح ل الحافة في نهاية هذا الأسبوع، قال متحدث باسم Google إنه “شاهد تقارير غير مؤكدة” حول تدريب OpenAI.
يوتيوب شروط الخدمة منع أي مستخدم من تنزيل محتواه، بما في ذلك استخدام شبكات الروبوت أو أدوات النسخ، ما لم يكن لديه أذونات واضحة من الشركة. يحظر موقع YouTube أيضًا استخدام محتواه لأي استخدامات “مستقلة” لخدمته.
وقالت ميرا موراتي، الرئيس التنفيذي للتكنولوجيا في OpenAI: “غير متأكد“ما إذا تم استخدام مقاطع فيديو YouTube لتدريب نموذج الذكاء الاصطناعي لتحويل النص إلى فيديو الخاص بشركتها سورا عندما سئل من صحيفة وول ستريت جورنال في مارس. لم يذكر تقرير صحيفة نيويورك تايمز شيئًا عن سورا، أو مقاطع يوتيوب الفعلية نفسها. إلا أن ترددها في الإجابة على هذا السؤال بشكل مباشر يؤدي إلى مزيد من التكهنات.
صحيفة نيويورك تايمز نفسها موجودة معركة حقوق النشر مع OpenAI في اللحظة. يتم أيضًا رفع دعوى قضائية ضد OpenAI وMeta من قبل عدد من المؤلفين ودور المحتوى لتدريب الذكاء الاصطناعي الخاص بهم على الأعمال المحمية بحقوق الطبع والنشر.
إذا كانت هذه التقارير صحيحة، فقد تثير أسئلة جديدة تمامًا حول قانون حقوق الطبع والنشر في عالم الذكاء الاصطناعي. تم تقديم معظم شكاوى حقوق الطبع والنشر المتعلقة بالذكاء الاصطناعي من قبل ناشرين صغار، ولكن يمكن لجوجل أن تضيف بعض الوزن الحقيقي وراء هذه المعركة إذا اختارت المشاركة. كما أنه سيوفر طريقة لجوجل لإبطاء OpenAI، والتي بلا شك تفوز بسباق الذكاء الاصطناعي في الوقت الحالي.
اكتشاف المزيد من موقع دبليو 6 دبليو
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.