الذكاء الاصطناعي: المُزيّفات العميقة في صناعة الترفيه

يونيو 2022

من إعداد فيجاي لالا، وأدين ميتراني وزاك هارند، وفينويك، نيويورك وسانتا مونيكا، الولايات المتحدة الأمريكية

منذ إطلاق فيلم Terminator الأول، رأينا تصورات لروبوتات تسيطر على العالم. نحن الآن على أبواب عملية ستقلب التكنولوجيا - على وجه التحديد، الذكاء الاصطناعي - من خلالها موازين صناعة الترفيه والإعلام.

يُشير مصطلح "المُزيّف العميق" إلى تكنولوجيا مبنية على الذكاء الاصطناعي تركِّب الوسائط. وذلك يتضمن تركيب السمات البشرية على جسد شخص آخر - و/ أو التلاعب بالأصوات - لإنشاء تجربة إنسانية واقعية. (الصورة: ©‏MIT‏/Halsey Burgund)

من وسائل الترفيه التقليدية وحتى الألعاب، نستكشف كيف أصبحت تكنولوجيا المُزيّف العميق مقنعة بشكلٍ متزايد ومتاحة لعامة الناس، ومقدار التأثير الذي سيحدثه استخدام هذه التكنولوجيا على النظام البنائي للترفيه والإعلام.

ما هو "المُزيّف العميق" ولمَ يُعد مهماً؟

يُشير مصطلح "المُزيّف العميق" إلى تكنولوجيا مبنية على الذكاء الاصطناعي تركِّب الوسائط. وذلك يتضمن تركيب السمات البشرية على جسد شخص آخر - و/ أو التلاعب بالأصوات - لإنشاء تجربة إنسانية واقعية. فقد الممثل فال كيلمر صوته المميز بسبب سرطان الحلق في عام 2015، ولكن تم استخدام تكنولوجيا المُزيّف العميق من شركة سونانتيك حديثاً للسماح لكيلمر "بالتحدث." (انهمرت دموع ابن الممثل عندما سمع "صوت" أبيه مرة أخرى).

استخدمت المُزيّفات العميقة لهدم الحواجز اللغوية، بما في ذلك من قِبَل لاعب كرة القدم الإنجليزي ديفيد بيكهام في حملته للتوعية ضد الملاريا "لا ملاريا بعد الآن". حيث مكّنت المُزيّفات العميقة بيكهام من إيصال رسالته بتسع لغات مختلفة. تستخدم المُزيّفات العميقة في بعض الأحيان لمجرد اللهو، مثلما في النصب الفني الخاص بسلفادور دالي، والذي سمح للمستخدمين بأخذ صورة ذاتية "سريالية" معه.

مقطع الفيديو: تم استخدام المُزيّفات العميقة لهدم الحواجز اللغوية، بما في ذلك من قِبَل لاعب كرة القدم الإنجليزي ديفيد بيكهام في حملته للتوعية ضد الملاريا "لا ملاريا بعد الآن"، حيث مكّنته من إيصال رسالته بتسع لغات مختلفة.

الاستفادة من تكنولوجيا المُزيّفات العميقة لتحسين مهارات الموهبة

حالياً، تتضمن التطبيقات التجارية للمُزيّفات العميقة كلاً من تعيين "ممثلي المُزيّف العميق" الأساسيين، بالإضافة إلى الأفراد الذين يتم استخدام تشابههم "كغلاف" (أي الوجه أو المظهر الذي يتم تصويره في المحتوى) للأداء الأساسي. وعندما يكون الشخص الذي يدعى "الغلاف" شخصية مشهورة، قد يوفّر ذلك تكلفة ساعات عمل صاحب الموهبة الأساسي التي قد يحتاجونها في موقع التصوير، حيث يمكن تحويل هذا العبء إلى ممثل المُزيّف العميق بدلاً من ذلك. بالإضافة إلى ذلك، تتيح مثل هذه التكنولوجيا للمؤثرين إنشاء رسائل مخصصة لمئات الآلاف من الأفراد بدون الحاجة إلى التدوين الفعلي لكل رسالة.

لا تُحدث التطبيقات الجديدة التي سبقت هذه التكنولوجيا تغييراً جذرياً لطبيعة اتفاقيات المواهب أو اكتساب الحقوق الضرورية من الموهبة، غير أنها تقدم تطورات مفاجئة يتعين على طرفي التفاوض النظر فيها بعناية. على سبيل المثال، يتم التفاوض بشأن التحكم في استخدام حقوق مظهر الموهبة بتفاصيل أكثر، إلا أنه ليس من المحتمل أن تراعي إصدارات أو اتفاقات المواهب عموماً الحق في استخدام حقوق المظهر كغلاف لتحقيق عدد لا يُحصى على الأرجح من المُزيّفات العميقة الواقعية. بالإضافة إلى ذلك، سوف تتطلب البنود المتعلقة بالحقوق المعنوية صياغة دقيقة لبيان إذا ما كان أداء المُزيّف العميق، ذلك الأداء الذي لا تتمتع فيه الموهبة على الأرجح بأي وجه من أوجه التحكم، يمكن أن يُتخذ كأساس يستدعي الإنهاء. وقد يتحتم على نقابات المواهب أيضاً إمعان النظر أكثر في طريقة تناول هذه التكنولوجيا على وجه التحديد في مفاوضات الصناعة المستقبلية.

أخيراً، ثمة مسألة مطروحة بشأن إذا ما كانت هذه التكنولوجيا سوف تساعد المواهب أو تضر بها بوجه عام. ثمة جانب إيجابي لهذا الأمر يكمن في أن إمكانية التوسع التي تتيح لممثل معين الظهور في الإعلانات أو على المواقع الإلكترونية للتجارة الإلكترونية في جميع أنحاء العالم (بدون الحاجة إلى الذهاب إلى الاستوديو أو تعلم لغة جديدة أو تحسين محاكاة اللهجة) قد تكون عاملاً لمنح الثقة. فعلى سبيل المثال، فعلت شركة سينثيسيا هذا الأمر مؤخراً في إعلانين ظهر فيهما مغني الراب ورائد الأعمال سنوب دوغ. وحقق الإعلان الأول نجاحاً كبيراً ما دفع الشركة الفرعية لطلب استخدام نفس الإعلان، ولكن مع تبديل العلامات التجارية والأسماء. وبدلاً من الاضطرار إلى إعادة التصوير، استخدمت سينثيسيا تكنولوجيا المُزيّف العميق لتغيير حركات فم سنوب دوغ؛ لتتناسب مع اسم الشركة الفرعية في الإعلان الجديد.

ومن الناحية الأخرى، يمكن أن يسمح الانتشار واسع النطاق للمُزيّفات العميقة باستبدال الممثلين غير المشهورين؛ ما يُفضي إلى فقدان الوظائف أو حدوث تحول في كيفية تعيين المجال للمواهب بالنسبة لعمليات الإنتاج. وإذا أصبح من الأكثر كفاءة بل ومن المرغوب فيه تعيين أشخاص مجهولين نسبياً لتصوير أولئك المشهورين، فهناك فرص أقل لهؤلاء الممثلين ليصبحوا مشهورين أو "يتم اكتشافهم" واعتبارهم فنانين. ويمكن أن يفضي ذلك إلى إنشاء طائفة من مُمثلي المُزيّفات العميقة الذين لن يحققوا الشهرة أبداً أو يتمتعون بالقدرة على تحقيق الاستفادة المالية من اسمهم ومظهرهم.

أطلق مركز MIT للواقع الافتراضي المتقدم مشروعاً رقمياً جديداً لسرد القصص في عام 2020؛ لتثقيف الجمهور بشأن المُزيّفات العميقة وإظهار مدى إقناعهم. وبفضل مساعدة أحد ممثلي التزييف العميق، ابتكر الفريق مُزيّفاً عميقاً "كاملاً" (تم التغيير في الصوت والفيديو) للرئيس الأمريكي نيكسون عندما كان يلقي خطاب الطوارئ الحقيقي المكتوب في عام 1969 في سيناريو لم يتمكن فيه طاقم أبولو 11 من العودة إلى الأرض. (الصورة: ©‏MIT‏/Halsey Burgund)

إدراج المُزيّفات العميقة للمشاهير في المحتوى الرقمي

لقد استفاد الأفراد كذلك من تكنولوجيا المُزيّفات العميقة للمشاهير على منصات وسائل التواصل الاجتماعي؛ ما يبرز أكثر انتشار (ودقة) التكنولوجيا الأساسية. في أوائل عام 2021، عمل فنان بلجيكي يستخدم الذكاء الاصطناعي مع شخص ينتحل شخصية توم كروز لإنشاء مقاطع فيديو واقعية للغاية "لتوم كروز" على منصة تيك توك باستخدام الحساب @deeptomcruise. وأظهرت مقاطع الفيديو تلك مشاركة "توم كروز" في أنشطة غريبة، بدءاً من السقوط وإلقاء مزحة عن الاتحاد السوفيتي في متجر بيع بالتجزئة إلى أداء خدمات تنظيف صناعية، وقد استقطبت مئات الآلاف من المشاهدات. كما، انتشر مُزيّف عميق لهاري ستايلز يطالب بمزيد من الفراولة في قصيدة غنائية في أغنيته Watermelon Sugar انتشاراً سريعاً فور نشره على تيك توك العام الماضي.

وإذا رغب فرد أو شركة في إنشاء فيديو مُزيّف عميق لأحد المشاهير لمحتوى على وسائل التواصل الاجتماعي، فعليه إمعان النظر مع محامٍ في إذا ما كان ذلك مسموحاً بموجب القانون المعمول به أم لا. يتعين عليه الاطلاع على بعض القواعد القانونية الرئيسية لنشر هذا النوع من المحتوى، بما في ذلك إذا ما كان المحتوى فئة محمية من حرّية التعبير (على سبيل المثال، محاكاة ساخرة)، وإذا ما كانت حقوق الدعاية للشخصية المشهورة تقع ضمن الملك العام أم لا وإذا ما كانت تتمتع بحجة الاستخدام العادل في دعوى انتهاك حق المؤلف. وخلافاً لذلك، كما هو الحال في جميع الحالات الأخرى، قد يتطلب استخدام مظهر الموهبة في هذا السياق موافقة.

مراعاة القوانين المعمول بها

يتغير المشهد القانوني للمُزيّفات العميقة في الولايات المتحدة تغيراً سريعاً. ويتعين على أي فرد أو شركة مراعاة قوانين الولاية الحديثة التي تتناول تحديداً الوسائط الاصطناعية وتلك التي يتم التلاعب بها رقمياً.

فمثلاً، في نوفمبر 2020، سنت ولاية نيويورك قانوناً يحظر صراحةً استخدام "نسخة رقمية طبق الأصل لفنان أداء متوفى" في محتوى سمعي بصري لمدة 40 عاماً بعد وفاة فنان الأداء، إذا كان ذلك الاستخدام "يُرجح أن يخدع الجمهور بالتفكير بأنه مرخص". وقد يحظر ذلك استخدام المُزيّفات العميقة في حالات مثل الفيلم الوثائقي لأنتوني بورداين بعنوان Roadrunner (الجوّاب). وعلى نحو يثير الجدل، استغل مخرج الفيلم تكنولوجيا المُزيّفات العميقة لإنشاء ثلاثة أسطر أعادت "صوت بورداين إلى الحياة" من أجل إكمال الإنتاج بعد وفاته، رُغم تأكيد أوتافيا بورداين، أرملة الشيف الشهير، أنها لم تعط الإذن بمثل هذا الاستخدام.

ومن الناحية السياسية، سنت ولاية تكساس قانوناً  في سبتمبر 2019 يحظر نشر "مقاطع فيديو المُزيّفات العميقة" المخادعة التي تهدف إلى إلحاق الضرر بالمرشحين أو التأثير على قاعدة الناخبين في غضون 30 يوماً من الانتخابات. وفي الشهر الذي يليه، أصدرت ولاية كاليفورنيا قانوناً مماثلاً لكنه حدد مدة النشر على أن تكون في غضون 60 يوماً من الانتخابات. وعلاوة على ذلك، سوف تحتاج أيضاً المنصات التي تستضيف المُزيّفات العميقة إلى مراعاة الشواغل المتعلقة بالامتثال فيما يخص شكاوى الخداع.

أحياناً ما تُستخدم المُزيّفات العميقة لغرض المرح. تُعد Dali Lives تجربة ذكاء اصطناعي رائدة في متحف دالي في فلوريدا، الولايات المتحدة الأمريكية. وتستخدم التعلم الآلي لإنشاء نسخة من مظهر دالي في الوقت الحاضر، والتي تظهر على مجموعة من الشاشات التفاعلية. كما يتسنى للزوار التقاط صورة شخصية "سريالية" مع السيد. (الصورة: بإذن من متحف دالي في سانت بطرسبرغ، فلوريدا، الولايات المتحدة الأمريكية)

تعزيز شخصيات ألعاب الفيديو باستخدام تكنولوجيا المُزيّفات العميقة

تُعد صناعة الألعاب ساحة طبيعية أخرى لقلب الموازين بسبب المُزيّفات العميقة، لا سيما فيما يتعلق بالشخصيات الافتراضية. وتكمن الفكرة الأساسية للكثير من الألعاب في أداء اللاعب لدور شخصية معينة مثل لوك سكاي ووكر أو الأميرة ليا من Star Wars. إلا أن تجربة اللعب الأكثر شمولاً لن تكون مجرد التحكم في لوكا أو ليا بواسطة لوحة ألعاب، ولكن أيضاً جعل الشخصية الافتراضية تتتبع حركات وجهك وفمك، وهذا ما تجعله تكنولوجيا المُزيّفات العميقة واقعاً. وعلاوة على ذلك، وبفضل النطق الآلي باستخدام تكنولوجيا المُزيّفات العميقة، هناك إمكانية لجعل صوتك يشبه صوت لوكا أو ليا؛ وقد حقق ذلك أحياناً نتائج إيجابية غير متوقعة. فمثلاً، تمكن "مظاهر الصوت" المزعومة هذه المثليات والمثليين ومزدوجي الميل الجنسي ومغايري الهوية الجنسية من تغيير أصواتهم داخل اللعبة؛ ما ينتج عنه لعب أكثر متعة، ولا يمثل ذلك نتيجة مفاجئة بالنظر إلى إحصائية 2020 التي أجرتها رابطة مكافحة التشهير والتي تشير إلى تعرض ما يزيد على نصف مستخدمي الدردشة الصوتية للتحرش أثناء اللعب، ويتعرض 37 بالمائة من لاعبي المثليات والمثليين ومزدوجي الميل الجنسي ومغايري الهوية الجنسية للتحرش على أساس ميولهم الجنسية.

في ظل مواصلة تغلغل المُزيّفات العميقة في جوانب مختلفة من الوسائط الرقمية، سوف يتعين على الأفراد والشركات التي تسعى إلى الاستفادة من التكنولوجيا الأساسية التفكير استباقياً من خلال الترتيبات التعاقدية الحالية والاطلاع على القانون المعمول به في هذا الصدد.

وبالطبع، يُحتمل أيضاً إساءة استخدام تكنولوجيا الأغراض العامة من هذا النوع، على سبيل المثال لانتحال الشخصية الاحتيالي لتحقيق مكاسب مالية أو عمليات تسجيل الدخول الاحتيالية للأنظمة الصوتية. وسوف تؤثر تكنولوجيا المُزيّفات العميقة على الشخصيات غير الخاضعة لتحكم اللاعب (NPCs) فضلاً عن شخصيتك الافتراضية. وسوف يفضي الجمع بين نماذج إنشاء اللغة الطبيعية الرائعة مثل GPT‑3 المقترنة بالمُزيّفات العميقة في الألعاب إلى امتلاك الشخصيات غير الخاضعة لتحكم اللاعب القدرة غير المحدودة على التحدث مع شخصيتك الافتراضية بحركات وجه وفم متزامنة مقنعة بدون الحاجة إلى اتباع نصوص مكتوبة معينة. وسوف يحتاج مطورو ألعاب الفيديو إلى تحليل ترتيبات الترخيص الحالية لديهم مع مالكي محتوى هذه الشخصيات والمنحنى السردي؛ لتحديد إذا ما كانت حالات استخدام المُزيّفات العميقة مسموحاً بها أم لا.

الفوائد المحتملة الأخرى

فضلاً عن الفوائد الاقتصادية لاستخدام المُزيّفات العميقة التي جرت مناقشتها أعلاه، يمكن أيضاً استخدام التكنولوجيا الأساسية للصالح الاجتماعي في الوسائط الرقمية. ولنضرب مثالاً بفيلم وثائقي يُعرض على شبكة HBO يسلط الضوء على حياة نشطاء مجتمع الميم الذين أُجبروا على العيش في سرية تحت تهديد الإعدام. ولحماية هويات هؤلاء النشطاء، استخدم الفيلم الوثائقي أغلفة المُزيّفات العميقة، حيث لم يستعرض المخرج سوى أغلفة لأشخاص كانوا نشطاء مجتمع الميم ولكنهم كانوا يقيمون في بلدان لا يتعرضون فيها لتهديد الموت بسبب ميولهم الجنسية. كما اعتادت المُزيّفات العميقة على إنشاء أصوات فريدة ومصممة حسب الطلب لملايين الأشخاص الذين يعتمدون على النطق الاصطناعي للتواصل.

اعتبارات عملية للمضي قدماً

في ظل مواصلة تغلغل المُزيّفات العميقة في جوانب مختلفة من الوسائط الرقمية، سوف يتعين على الأفراد والشركات التي تسعى إلى الاستفادة من التكنولوجيا الأساسية التفكير استباقياً من خلال الترتيبات التعاقدية الحالية والاطلاع على القانون المعمول به في هذا الصدد. وعلاوة على ذلك، يتعين على الأفراد الذين يبرمون اتفاقات مواهب مراجعة الشروط المتعلقة بحقوق الدعاية الخاصة بهم بعناية؛ للتأكد من أنهم يتمتعون بتحكم كافٍ في كيفية استخدام هذه الحقوق إلى جانب التكنولوجيات القائمة على الذكاء الاصطناعي. وإذا ما تم التعامل على نحو مدروس مع المُزيفات العميقة، فإنه يمكن الاستفادة من تطورها واستخدامها لما يحقق الخير على الصعيدين التجاري والاجتماعي.

الغرض من مجلة الويبو مساعدة عامة الجمهور على فهم الملكية الفكرية وعمل الويبو، وليست المجلة وثيقة من وثائق الويبو الرسمية. ولا يراد بالتسميات المستخدمة وبطريقة عرض المادة في هذا المنشور بأكمله أن تعبر عن أي رأي كان من جهة الويبو بشأن الوضع القانوني لأي بلد أو إقليم أو منطقة أو سلطاتها أو بشأن تعيين حدودها أو تخومها. ولا يراد بهذا المنشور أن يعبر عن آراء الدول الأعضاء أو أمانة الويبو. ولا يراد بذكر شركات أو منتجات صناعية محددة أن الويبو تؤيدها أو توصي بها على حساب شركات أو منتجات أخرى ذات طبيعة مماثلة وغير مذكورة.