اتخذت شركة علي بابا، عملاق التجارة الإلكترونية الصيني، خطوة فاجأت عددًا كبيرًا من الخبراء والمتحمسين من خلال تقديم EMO. يشير الاسم إلى "Emote Portrait Alive" والذي يُترجم على أنه تقنية قائمة على الذكاء الاصطناعي لإنشاء مقاطع فيديو من الصور. EMO هو الذكاء الاصطناعي التوليدي لشركة علي بابا والذي يصل إلى سوق لا يبدو مشبعًا بالمقترحات القائمة على الذكاء الاصطناعي.
ما يفعله EMO يتلخص في أنه قادر على إضفاء الحياة على أي صورة، وإنشاء فيديو واقعي للغاية يتحدث فيه الشخص في الصورة أو يغني. أنشأت علي بابا صفحة رسمية لـ EMO توضح فيها بشكل كامل مدى قدرة الذكاء الاصطناعي على أداء هذه المهمة، وقبل كل شيء، تقدم أمثلة على التطبيقات المختلفة لهذه الأداة.تم تطوير المشروع من قبل لينروي تيان، وتشي وانغ، وبانغ تشانغ، وليفنغ بو، الباحثين في معهد الذكاء الحاسوبي على بابا. تمكن هذا الفريق من إطلاق ذكاء اصطناعي للعالم يمكنه التنافس مع مشروع Sora من OpenAI. ووفقا لفريق الباحثين، فإن EMO قادر على خلق حركات وجه معبرة وطبيعية وسلسة.
كل هذا يعني أن النتائج واقعية للغاية، مما يجعل الصورة تنبض بالحياة وهناك القليل من العناصر التي تكشف عن أصلها. ومن الناحية المنطقية، كل هذا ضمن إطار يأخذ بعين الاعتبار بقية الأدوات المخصصة لهذه المهمة.
تقول الشركة على موقعها : " نقترح EMO، وهو إطار عمل لإنشاء مقاطع فيديو وصور شخصية يعتمد على الصوت. من صورة مرجعية واحدة وصوت صوتي، مثل التحدث والغناء، يمكن لطريقتنا إنشاء مقاطع فيديو لأفاتار صوتية مع تعبيرات وجه معبرة ووضعيات رأس مختلفة."
ما يمكنك قراءته على موقع EMO الرسمي يوضح تمامًا كيفية عمله. النموذج الذي طوروته حتى تتمكن EMO من تقديم الواقعية عند توليد النتائج يرجع إلى حقيقة أنها تمكنت من التقاط مجموعة كاملة من التعبيرات البشرية لتوظيفها في هذا الذكاء الإصطناعي .
تم تطوير EMO ليكون بمثابة مثال آخر على إمكانات الذكاء الاصطناعي وهو غير متوفر بعد، ولكن يجب أن يؤخذ في الاعتبار أن استخدامه يجب أن يكون ضمن الحدود الأخلاقية .
ليست هناك تعليقات:
إرسال تعليق