هناك العديد من مشاريع الذكاء الاصطناعي التي تلتقط الصورة وتحولها إلى فيديو، لكن حتى الآن لم أرى مثل هذا بين يدي غوغل.
إنه VLOGGER (اسم غريب)، وقد جاء من أيدي فريق من الباحثين في غوغل الذين قرروا إضفاء الحياة على الصور الثابتة، وتحويلها إلى مقاطع فيديو واقعية لأشخاص يتحدثون ويشيرون.
في الوقت الحالي، هي عبارة عن دراسة، مع ملف PDF على هذا الرابط، مع عدم وجود أداة متاحة بعد عبر الإنترنت، ولكن أجراس الإنذار تدق بالفعل في جميع أنحاء العالم حول التزييف العميق والمعلومات المضللة.المفتاح وراء VLOGGER هو استخدام نماذج الانتشار، وهي تقنية للتعلم الآلي أثبتت جودتها بشكل استثنائي في إنشاء صور واقعية من أوصاف النص. وقد امتدت هذه الطريقة إلى مجال الفيديو، مما يسمح بتحريك الصور الثابتة بشكل مقنع. ما يميز VLOGGER عن الأدوات المتوفرة الآن هو قدرته على العمل دون الحاجة إلى تدريب النموذج لكل شخص محدد، والتعامل مع الجسم بالكامل، والتكيف مع مجموعة واسعة من المواقف وتعبيرات الوجه.
المحرك وراء قدرات التعلم والتوليد في VLOGGER هو MENTOR، وهي مجموعة بيانات ضخمة تضم أكثر من 800000 هوية مميزة و2200 ساعة من الفيديو. تسمح هذه المجموعة الهائلة من البيانات لVLOGGER بالتقاط وإعادة إنتاج التنوع البشري في مقاطع الفيديو الخاصة به، من مختلف الأعراق والأعمار إلى مجموعة متنوعة من التعبيرات والسياقات.
ومع ذلك، من المهم ملاحظة أن مقاطع الفيديو التي تم إنشاؤها ب VLOGGER لا تنقل الأشخاص عبر بيئات ثلاثية الأبعاد، حيث تظل الخلفيات الثابتة. كل شيء لا يبدو مثاليًا حاليا ، كما يظهر في هذا الفيديو:
@wwwhatsnew VLOGGER, la nueva herramienta de Google para crear animación a partir de fotos
♬ sonido original - Wwwhatsnew
يعد تقديم غوغل لـ VLOGGER بمثابة تذكير بالوتيرة التي نسير بها. تتغير الأدوات من أسبوع إلى آخر... والآن علينا فقط أن ننتظر حتى تصبح هذه التكنولوجيا أداة عبر الإنترنت و متاحة للجميع.
ليست هناك تعليقات:
إرسال تعليق