يمكن لمولِّد الصوت بالذكاء الاصطناعي من ElevenLabs تزييف الأصوات في 30 لغة
ما الذي أصبح إحدى الشركات التي تذهب إلى الإنترنت لإنشاء صور مرئية واقعية بدرجة كافية يتمتع deepfakes الآن بالقدرة على استنساخ صوتك وإجباره على التحدث بألسنة متنوعة ومتنامية. أعلنت شركة ElevenLabs يوم الثلاثاء أن استنساخها الصوتي الجديد يدعم الآن 22 لغة أكثر مما كانت عليه في السابق ، بما في ذلك الأوكرانية والكورية والسويدية والعربية والمزيد.
وفقًا لـ ElevenLAbs ، يعد نموذج Multilingual v2 الجديد بإمكانية إنتاج صوت “ثري عاطفياً” بإجمالي 30 لغة. الشركة يقدم أداتين صوتيتين للذكاء الاصطناعي ، أحدهما نموذج لتحويل النص إلى كلام والآخر هو “VoiceLab” الذي يتيح للمستخدمين الذين يدفعون رسوم استنساخ صوت عن طريق إدخال أجزاء من خطابهم (أو غيرهم) في النموذج لإنشاء نوع من مخروط الصوت . باستخدام نموذج v2 ، يمكن للمستخدمين الحصول على هذه الأصوات التي تم إنشاؤها لبدء التحدث باللغة اليونانية أو الماليزية أو التركية.
بدأت الخدمة مباشرة على موقع الشركة في منتصف نهار الثلاثاء بالتوقيت الشرقي. يحتاج المستخدمون فقط إلى كتابة النص بلغته الفعلية لسماع الصوت المترجم ، ويجب أن يعمل مع أي استنساخ صوتي تم إنشاؤه بواسطة الشركة أو بواسطة المستخدمين. بصفتك متحدثًا رئيسيًا للغة الإنجليزية ، من الصعب قياس مدى جودة تمثيل كل صوت لهجة كل لغة ، لكن الكلام يستغرق وقتًا ليبدو طبيعيًا مع توقف التنفس من حين لآخر بين الجمل والاقتباسات.
شهدت منصة ElevenLabs نصيبها من الجدل بعد إطلاقها العام الماضي. شهدت المنصة التجريبية الأولية للشركة استخدام مستخدمي 4Chan لأنظمتها لانتحال شخصيات المشاهير ، إجبارهم على قول نصوص عنصرية وكارهة للنساء وكراهية المتحولين جنسياً. كما تم استخدامه من قبل المبشرون بالذكاء الاصطناعي لمهاجمة الممثلين الصوتيين الذين اشتكوا من الاستخدام الواسع لتقنية استنساخ الصوت. منذ ذلك الحين ، تطالب شركة ElevenLabs بإجراءاتها المتكاملة الجديدة لضمان أن المستخدمين يمكنهم استنساخ أصواتهم فقط. يحتاج المستخدمون إلى التحقق من كلامهم من خلال موجه حروف التحقق النصي الذي تتم مقارنته بعد ذلك بعينة الصوت الأصلية.
المؤسس المشارك للشركة ، السابقبلانتير قال المدير التنفيذي Mati Staniszewski في بيان: “في النهاية نأمل في تغطية المزيد من اللغات والأصوات بمساعدة الذكاء الاصطناعي وإزالة الحواجز اللغوية أمام المحتوى.”
خارج الإصدار التجريبي ، تحاول ElevenLabs دفع أصوات الذكاء الاصطناعي إلى الوسائط
إلى جانب القدرات اللغوية الجديدة ، زعمت شركة ElevenLabs أيضًا أن هذه الدفعة تشير الآن إلى أن تقنية استنساخ الصوت بالذكاء الاصطناعي الخاصة بها لم تعد في مرحلتها التجريبية تمامًا كما تعمل الشركة بشكل أعمق في إتاحة التكنولوجيا لشركات الإعلام. مرة أخرى في يونيو ، تلقى ElevenLabs 19 مليون دولار للتمويل الأولي من أمثال صانعي الملوك التكنولوجيين أندريسن هورويتز جنبًا إلى جنب مع رئيس DeepMind السابق ، الآن مصطفى سليمان ، أحد مؤسسي شركة Inflection AI.
تروج ElevenLabs لتقنية استنساخ الصوت الخاصة بها كطريقة للشركات لإنشاء كتب صوتية ومقاطع فيديو وحتى صوت NPCs في ألعاب الفيديو. الشركة المطالبات لقد أبرمت صفقة مع Paradox Interactive ، الناشر وراء ألعاب مثل قلوب من حديد المسلسل والقادم رابطة المصارعين. تم الاستشهاد بشكل صريح بتقنية استنساخ الصوت للشركة صوت الألعاب على الممثلين الذين يشعرون بالقلق من استخدام التكنولوجيا لتقويض عملهم.
تواصلت Gizmodo مع Paradox للتعليق ، لكننا لم نتلق ردًا على الفور.
على صعيد الكتب ، حاول عمالقة التكنولوجيا مثل Google و Apple دفع الكتب الصوتية المروية بالذكاء الاصطناعي. بدأ تطبيق Apple Books في عرض الرواة بأسماء لطيفة مثل “Archie” و “Warren” للتعبير عن بعض المحتوى. لاحظ أولئك الذين يستمعون إلى الكتب الصوتية أن هذه الأصوات – بسبب عدم وجود مصطلح أفضل –هامدة مقارنة بمخزون الممثلين الصوتيين المحترفين الذين يمكنهم في الواقع الانتباه إلى صعود وهبوط السرد. نقابة الممثلين SAG-AFTRA ونقابة الكتاب الأمريكية في إضراب حاليًا ، وجزء كبير من المفاوضات الحالية مع صناعة الترفيه تركزت على الذكاء الاصطناعي.
ومع ذلك ، تروج ElevenLabs لإمكانية توفير أصوات الذكاء الاصطناعي لشركات النشر الوقت والمال في إنشاء كتب صوتية. في منشور مدونة يوم الاثنين ، الشركة ترقية عملت مع Lukeman Literary ، وهي وكالة أدبية وشركة نشر صغيرة مستقلة ، لضبط معالجة الكتب المسموعة الخاصة بها. ادعت الشركة أنها كانت تستغرق “أسابيع” من Lukeman لإنتاج كتاب صوتي واحد ، ولكن باستخدام الذكاء الاصطناعي تم اختصاره إلى مجرد ساعات.
ساعد Lukeman Literary في نشر كتب لشخصيات عامة بارزة مثل Rutger Hauer والدالاي لاما إلى جانب أعمال خيالية أخرى. في رسالة بريد إلكتروني تم إرسالها إلى Gizmodo ، شدد لوكمان على أن وكالته وأذرع النشر الخاصة به كانت متميزة ، لذلك لم تكن هناك أي خطط لتحويل العناوين الممثلة للوكالة إلى سرد للذكاء الاصطناعي. ومع ذلك ، فيما يتعلق بأعمال النشر الخاصة به ، قال إنه لم يتبنَّ أبدًا رواية الذكاء الاصطناعي لأن “الجودة” لم تكن موجودة ، ولكن منذ اختبار ميزات ElevenLabs ، قال إنه “أعجب أخيرًا” بما يكفي لاستخدامه. وزعم كذلك أن “السرد بالذكاء الاصطناعي هو هبة من السماء” للكتاب المستقلين لأنه أرخص بكثير من السرد البشري.
على الرغم من إعلان أن صوت الذكاء الاصطناعي أصبح أخيرًا جيدًا بما يكفي في وقت الذروة ، وافق لوكمان على أن الذكاء الاصطناعي “سيشكل بالتأكيد تحديًا” للممثلين الصوتيين ، لكنه اقترح أن “بعض” المؤلفين والناشرين سيظلون يريدون كتبًا صوتية بصوت إنسان حقيقي.
سواء أكان ممثلو الصوت قادرون في النهاية على ترخيص أصواتهم للذكاء الاصطناعي للمخلفات أم لا ، فإن هذا النوع من الاتفاقيات لا يزال غريبًا على صناعة النشر. أصبح مفتونًا أكثر فأكثر مع الذكاء الاصطناعي. مع استمرار الإضراب ، قد يستغرق الأمر بعض الوقت لمعرفة كيفية استجابة الجهات الفاعلة بشكل عام لصناعة تبحث عن طريقة للاستفادة من اتجاه الكتب الصوتية ، ولكن بدون صوت بشري حقيقي.
اكتشاف المزيد من موقع دبليو 6 دبليو
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.