Fiction Analytics Site Prosecraft مغلق بعد رد فعل عنيف
Prosecraft.io ، موقع يستخدم الروايات للمساعدة في تشغيل أ مشروع يعتمد على البيانات لعرض عدد الكلمات ، والصوت المبني للمجهول ، وغير ذلك من علامات الكتابة ذات الطابع الشخصي مثل الحيوية ، والتي تم إغلاقها اليوم بعد أن اعترض المؤلفون على المشروع. تستخدم Prosecraft نص كامل لأكثر من 25000 كتاب– وهي مادة مكتوبة بالكامل – من أجل تطوير مكتبة للبيانات. المؤلفون ، بمجرد أن علموا بما كان يحدث ، كرهت هذا على الفور.
كان زاك روزنبرغ هو المؤلف الذي لفت انتباه المؤلفين إلى هذا الموقع لأول مرة على X ، وهو الموقع المعروف سابقًا باسم Twitter. قريبًا ، تحدث المزيد والمزيد من المؤلفين ، بما في ذلك المؤلفون البارزون مثل Jeff VanderMeer (الوصول الجنوبي ثلاثية) ، إندرا داس (المفترسون) ، جريتشن فيلكر مارتن (مطاردة)
يرجع جزء من هذا إلى أن Prosecraft اعترفت باستخدام “خوارزميات الذكاء الاصطناعي. ” في منشور مدونة بتاريخ 5 أكتوبر 2018 ، صرح Benji Smith ، مطور كل من Prosecraft وبرنامج الكتابة Shaxpir الذي كان يعتمد على البيانات المستخرجة من مكتبة Prosecraft ، قائلاً: “لقد علمنا خوارزميات التعلم الآلي (AI) لدينا للتعرف على أي منها يمكن استخدام أنواع الكلمات في أي نوع من السياقات ، من خلال النظر في أنواع الكلمات والعبارات التي تميل إلى الحدوث في جمل وفقرات متشابهة “. بالإضافة إلى ذلك ، كتب أن Shaxpir “(حلل) أكثر من 560 مليون كلمة روائية ، من أكثر من 5800 كتاب ، كتبها أكثر من 3300 مؤلف مشهور.” ولا يفصح عن المكان الذي حصل فيه على تلك الأعمال الخيالية ، أو ما إذا كان قد حصل على إذن للقيام بذلك أم لا.
بينما التكنولوجيا المستخدمة ليست كذلك بالضرورة نموذج كبير لتوليد اللغة مثل ChatGPT ، ليس من المبالغة القول إن دمج خوارزميات LLM التوليدية كان من الممكن أن يكون في الأفق لـ Prosecraft. وبما أن الموقع يحتوي على مكتبة ضخمة من الكتب ، فإن مخاوف المؤلف صحيحة بشكل لا يصدق. في أعقاب رد الفعل العنيف هذا ، كتب سميث ملف مدونة مطولة على المتوسط يشرح لماذا قام طواعية بإنزال Prosecraft.
على الرغم من أن Prosecraft كانت تستخدم أجزاء من النص فقط ، إلا أنها لم تحصل على إذن من أي مؤلفين أو ناشرين لإنشاء قاعدة بيانات بناءً على العمل الكامل للمؤلف أو النص الكامل للكتاب. كتب سميث على المدونة ، “نظرًا لأنني كنت أنشر فقط إحصاءات موجزة ومقتطفات صغيرة من نص تلك الكتب ، فقد اعتقدت أنني كنت أحترم روح مبدأ الاستخدام العادل ، الذي لا يتطلب موافقة المؤلف الأصلي. “
بينما هذا يحمل بعض الماء ، لا يسمح الاستخدام العادل ، بأي حال من الأحوال ، باستخدام عمل المؤلف بالكامل المكتوب بموجب حقوق الطبع والنشر دون إذن كجزء من برنامج تدريب البيانات الذي يغذي “الذكاء الاصطناعي” الخاص بك الخوارزمية. ” في حين أن هذا الموقف سيكون بالتأكيد درسًا للعديد من الأشخاص ، فمن الواضح أن المؤلفين لن يسمحوا باستخدام عملهم لتدريب LLM وشبكات المتجهات.
هل تريد المزيد من أخبار io9؟ تحقق من متى تتوقع الأحدث أعجوبةو حرب النجوم، و ستار تريك الإصدارات ، ما هي الخطوة التالية لـ DC Universe على الفيلم والتلفزيون، وكل ما تحتاج لمعرفته حول مستقبل دكتور من.