مولد الفيديو Sora من OpenAI مذهل ولكنه مرعب
OpenAI قدم سورا، المولد الرئيسي لتحويل النص إلى فيديو، يوم الخميس بمقاطع فيديو جميلة وواقعية بشكل صادم تعرض قدرات نموذج الذكاء الاصطناعي. أصبح Sora متاحًا الآن لعدد صغير من الباحثين والمبدعين الذين سيختبرون النموذج قبل إصداره على نطاق أوسع، وهو ما قد يتسبب في كارثة لصناعة السينما و مشكلتنا الجماعية في التزييف العميق.
قال OpenAI في مقال: “Sora قادر على إنشاء مشاهد معقدة بشخصيات متعددة، وأنواع محددة من الحركة، وتفاصيل دقيقة للموضوع والخلفية”. مشاركة مدونة. “لا يفهم النموذج ما طلبه المستخدم في الموجه فحسب، بل يفهم أيضًا كيفية وجود هذه الأشياء في العالم المادي.”
ولم يذكر OpenAI متى سيتم إصدار Sora للجمهور.
Sora هو أول مشروع لـ OpenAI في مجال إنشاء فيديو الذكاء الاصطناعي، مما يضيف إلى النص والمحتوى المدعوم بالذكاء الاصطناعي الخاص بالشركة مولدات الصورو ChatGPT و دال-E. إنها فريدة من نوعها لأنها أقل من مجرد أداة إبداعية، وأكثر من مجرد “محرك الفيزياء القائم على البيانات,“كما أشار كبير الباحثين في Nvidia الدكتور جيم فان. لا يقوم Sora بإنشاء صورة فحسب، بل يحدد فيزياء الجسم في بيئته ويعرض مقطع فيديو بناءً على هذه الحسابات.
لإنشاء مقاطع فيديو باستخدام Sora، يمكن للمستخدمين ببساطة كتابة بضع جمل كمطالبة، تمامًا مثل مولدات الصور المدعومة بالذكاء الاصطناعي. يمكنك الاختيار بين أسلوب الصور الواقعية أو أسلوب الرسوم المتحركة، مما يؤدي إلى نتائج مذهلة في بضع دقائق فقط.
Sora هو نموذج نشر، مما يعني أنه يقوم بإنشاء فيديو من خلال البدء بفيديو ضبابي مملوء بالثبات ثم يقوم بتنعيمه ببطء إلى الإصدارات المصقولة التي تراها أدناه. إن مولدات الصور والفيديو الخاصة بـ Midjourney وStable Diffusion هي أيضًا نماذج نشر.
ومع ذلك، يجب أن أشير إلى أن Sora من OpenAI أفضل بكثير. تعد مقاطع الفيديو التي ينتجها Sora أطول وأكثر ديناميكية وتتدفق معًا بشكل أفضل من المنافسين. تبدو شركة Sora وكأنها تنشئ مقاطع فيديو حقيقية، في حين تبدو النماذج المنافسة وكأنها توقف حركة صور الذكاء الاصطناعي. لقد أطلقت OpenAI مرة أخرى مجالًا آخر للذكاء الاصطناعي باستخدام مولد فيديو يضع المنافسة في العار.
مقاطع الفيديو التي أنتجها سورا مذهلة بلا شك. كان من الممكن أن يستغرق إنتاج مقاطع الفيديو هذه ساعات طويلة بواسطة طاقم فيلم حقيقي أو رسامي رسوم متحركة. من المحتمل أن يكون Sora مدمرًا لصناعة السينما بنفس الطريقة التي صدمت بها مولدات الصور ChatGPT والذكاء الاصطناعي عالم التحرير والتصميم. إنها تقنية رائعة ومخيفة في نفس الوقت من حيث الأمن الوظيفي لمنشئي الفيديو.
يقول OpenAI أن هناك بعض التعديلات التي يجب العمل عليها، بما في ذلك عدم فهم السبب والنتيجة. قد يقوم Sora بإنشاء مقطع فيديو لشخص يتناول قضمة من ملف تعريف الارتباط، ولكن بعد ذلك، قد لا يكون هناك علامة قضمة على ملف تعريف الارتباط. تقول OpenAI أيضًا أن النموذج يفتقر إلى الوعي المكاني. وقد يخلط بين اليسار واليمين، ولا يفهم كيف يتفاعل شخص أو كائن مع المشهد.
السلامة هي أيضا مصدر قلق رئيسي، على وجه الخصوص بالنظر إلى كيفية إساءة استخدام تقنية الذكاء الاصطناعي لإنشاء صور مزيفة في الأشهر الأخيرة. وتقول شركة OpenAI إنها ستقوم ببناء أدوات للمساعدة في اكتشاف المحتوى المضلل، بالإضافة إلى تطبيق التقنيات الحالية التي ترفض المطالبات النصية الضارة. ومع ذلك، وبالنظر إلى الطرق التي تجاوز بها الناس تدابير الحماية لنماذج الذكاء الاصطناعي الحالية، فمن المشكوك فيه مدى نجاح هذه الجهود.
إن لعبة Sora مثيرة للإعجاب بقدر ما هي مرعبة، ومن الواضح كيف يمكن لمولد الفيديو القوي هذا الذي يعمل بالذكاء الاصطناعي أن يعطل صناعة الأفلام ويخلق مخرجات ضارة. تخيل لو كانت فيديوهات تايلور سويفت العميقة عبارة عن مقاطع فيديو. أو ماذا لو مكالمة هاتفية عميقة لجو بايدن مع ناخبي نيو هامبشاير هل كانت رسالة واقعية من المكتب البيضاوي؟ Sora ليس متاحًا للعامة بعد، لكن الآثار المترتبة على التكنولوجيا القوية هذه تسبق إطلاقه.
اكتشاف المزيد من موقع دبليو 6 دبليو
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.