تحتوي مجموعة بيانات الذكاء الاصطناعي المؤثرة على آلاف صور الاعتداء الجنسي على الأطفال المشتبه بها
كشف تقرير أكاديمي جديد أن مجموعة بيانات مؤثرة للتعلم الآلي – تم استخدام أمثالها لتدريب العديد من تطبيقات توليد الصور الشائعة – تتضمن آلاف الصور المشتبه بها لاعتداء جنسي على الأطفال.
ال تقريرتقول شركة ستانفورد، التي وضعها مرصد الإنترنت بجامعة ستانفورد، إن LAION-5B، وهي شريحة ضخمة من الوسائط المرئية، تتضمن عددًا كبيرًا من صور الإساءة غير القانونية.
تتم صيانة LAION-5B من قبل منظمة LAION غير الربحية (اختصار لشبكة مفتوحة للذكاء الاصطناعي واسعة النطاق) وهي ليست في الواقع مجموعة مخزنة من الصور ولكنها بدلاً من ذلك عبارة عن قائمة روابط للصور التي تمت فهرستها بواسطة المنظمة. تتضمن الروابط بيانات تعريفية لكل صورة، مما يساعد نماذج التعلم الآلي في العثور على صور للاستفادة منها في التدريب.
وللتدقيق في شريحة البيانات الموسعة هذه، استخدم الباحثون PhotoDNA، a أداة تصفية المحتوى الملكية تم تطويره بواسطة Microsoft لمساعدة المؤسسات على تحديد أنواع معينة من المحتوى المحظور والإبلاغ عنها، بما في ذلك CSAM. في سياق التمرير عبر مجموعة بيانات LAION، يقول الباحثون إن PhotoDNA عثرت على حوالي 3226 حالة من المواد المشتبه بها لإساءة معاملة الأطفال. ومن خلال استشارة المنظمات الخارجية، تمكن الباحثون من تحديد أن العديد من تلك الصور كانت حالات مؤكدة لـ CSAM. في حين أن مجموعة البيانات المعنية تتضمن مليارات الصور، فإن وجود أي قدر من محتوى إساءة الاستخدام في محتواها يجب أن يكون أمرًا مثيرًا للقلق.
وفي يوم الثلاثاء، بعد تلقي نسخة محظورة من تقرير جامعة ستانفورد، قامت LAION بإيقاف مجموعة البيانات عن الاتصال بالإنترنت و أصدر بيانا لمعالجة الجدل. يقرأ، في جزء منه:
تتبع LAION سياسة عدم التسامح مطلقًا مع المحتوى غير القانوني. نحن نعمل مع منظمات مثل الاتحاد الدولي لرفع الأثقال وآخرون لمراقبة الروابط والتحقق من صحتها باستمرار في مجموعات بيانات LAION المتاحة للعامة. يتم أيضًا التحقق من صحة مجموعات البيانات من خلال أدوات التصفية المكثفة التي طورها مجتمعنا والمنظمات الشريكة لضمان سلامتها وامتثالها للقانون.
…في ظل قدر كبير من الحذر، قمنا بإيقاف تشغيل LAION 5B ونعمل بسرعة مع IWF وآخرين للعثور على الروابط التي قد لا تزال تشير إلى محتوى مشبوه وربما غير قانوني على الويب العام وإزالتها.
تم استخدام LAION-5B لتدريب العديد من تطبيقات الذكاء الاصطناعي، بما في ذلك تطبيق إنشاء الصور Stable Diffusion الشهير تم إنشاؤها بواسطة الاستقرار AI. تواصلت Gizmodo مع Stability AI للتعليق وسوف تقوم بتحديث هذه القصة إذا استجابت.
اكتشاف المزيد من موقع دبليو 6 دبليو
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.