نيويورك تايمز تمنع شركات الذكاء الاصطناعي من كشط أرشيفها
نيويورك تايمز تصنع من الواضح أن صناعة الذكاء الاصطناعي لن تُطلق العنان لها لسرقة الصحف المحتوى لتدريب الخوارزميات. في تغيير حديث وفقًا لسياسة شروط الخدمة الخاصة بها ، حظرت التايمز صراحةً استخدام أرشيفات الوسائط الضخمة لأغراض تدريب “أي برنامج برمجي ، بما في ذلك ، على سبيل المثال لا الحصر ، تدريب نظام التعلم الآلي أو الذكاء الاصطناعي (AI).”
حدث تغيير TOS الخاص بالورقة في الأصل في 3 أغسطس و لوحظ لأول مرة بواسطة Adweek. تنطبق السياسة بشكل صريح على المحتوى النصي والصور ومقاطع الفيديو والبيانات الوصفية لصحيفة التايمز منع برامج زحف الويب الخاصة بالشركات من الوصول إلى تلك البيانات لتدريب المنتجات المسجلة الملكية.
أحد أكثر الجوانب إثارة للجدل في صناعة الذكاء الاصطناعي هو السؤال عن المكان الذي يمكن أو ينبغي لشركات الذكاء الاصطناعي أن تحصل فيه على بياناتها. يستغرق تدريب أنظمة الذكاء الاصطناعي كمية هائلة من البيانات (إلى جانب كمية مخيفة من قوة الحوسبة) ، وشركات مثل OpenAI – التي بنت بياناتها الدفينة إلى حد كبير عن طريق إلغاء البيانات المفتوحة (أو ليس منفتح جدا) الإنترنت – واجهت بالفعل مشاكل قانونية نتيجة لهذه الممارسات. مثال على ذلك: OpenAI حاليًا تواجه مجموعة من الدعاوى القضائية من الأشخاص والمؤسسات الذين يقولون إن الشركة سرقت بياناتهم ثم أعادت تجميعها واستثمارها.
ومع ذلك ، فإن عددًا من بائعي الذكاء الاصطناعي الكبار قد أعلنوا مؤخرًا أنهم يضاعفون من عملية تجريف الويب. جوجل ، على سبيل المثال ، أعلن مؤخرا أنه سيستمر تجريف الويب ما لم يُجبر على عدم القيام بذلك. يُظهر قرار التايمز بمنع الاستخدام المجاني لأرشيفها الإعلامي لمثل هذه الأغراض أن الصحيفة تتفهم قيمة بياناتها – ولا تنوي منحها مجانًا ، مما يمهد الطريق لتحديات قانونية محتملة.
محاولة منظمة العفو الدولية المستمرة للتواصل مع وسائل الإعلام
يأتي تغيير TOS في Times أيضًا في منعطف مثير للاهتمام في العلاقة المتطورة بين وسائل الإعلام الإخبارية وصناعة الذكاء الاصطناعي الناشئة.
في الآونة الأخيرة ، قامت شركات الذكاء الاصطناعي التودد بقوة الصحف والمؤسسات الإعلامية ، في محاولة واضحة لتطبيع استخدام أدوات الذكاء الاصطناعي في تنظيم الأخبار وإنشاء المحتوى. هذا منطقي ، لأن أحد أسواق كبيرة متوقعة للذكاء الاصطناعي هي وسائط رقمية. تبذل شركات الذكاء الاصطناعي قصارى جهدها لتأسيس موطئ قدم في سوق إخباري حذر ، وإحدى الطرق التي كانوا يفعلون بها ذلك هي تقديم خدمات وشراكات مجانية. مثال على ذلك: منذ وقت ليس ببعيد ، جوجل ينذر بالسوء اقترب عدد من المؤسسات الإخبارية القديمة – بما في ذلك التايمز وواشنطن بوست – في محاولة لبيعها على أداة جديدة للذكاء الاصطناعي ، يطلق عليها اسم “جينيسيس” ، والتي ادعت أنها “تساعد” الصحفيين.
في الوقت نفسه ، يبدو أن شركات الذكاء الاصطناعي تستنشق نوعًا آخر من الفرص عندما يتعلق الأمر بالشراكة مع وسائل الإعلام الإخبارية. نظرًا لأن تجريف الويب العشوائي قد أثبت أنه ممارسة مثيرة للجدل ، تبحث شركات الذكاء الاصطناعي حاليًا عن طرق جديدة وأكثر أمانًا من الناحية القانونية للحصول على البيانات التي يحتاجونها لتشغيل منتجاتهم بشكل صحيح. يبدو أن إحدى هذه الطرق هي الشراكة مع المؤسسات الإخبارية وتقديم خدمات الأتمتة المجانية مقابل الوصول إلى أرشيفات النصوص الضخمة للصحف. في الآونة الأخيرة ، وكالة أسوشيتد برس عقد صفقة مع شركة OpenAI من شأنه أن يسمح لبدء تشغيل الذكاء الاصطناعي بالوصول إلى أرشيفات نصوص AP واستخدامها. في المقابل ، عرضت OpenAI وصول AP إلى “خبرة OpenAI في التكنولوجيا والمنتجات.”
باختصار: تريد صناعة الذكاء الاصطناعي حقًا تحقيق التكامل مع الأخبار. ومع ذلك ، نظرًا للأخطار غير المعروفة التي قد ينطوي عليها مثل هذا التعاون ، فقد يكون من المنطقي أكثر لوسائل الإعلام أن تستمر في لعب الكرة الصعبة في الوقت الحالي.