تمت إضافة Runway Act-One مع إمكانية التقاط تعابير الوجه المدعومة بالذكاء الاصطناعي إلى طراز Gen-3 Alpha

أعلنت شركة Runway AI، وهي شركة ذكاء اصطناعي تركز على نماذج توليد الفيديو، عن ميزة جديدة يوم الثلاثاء. تتوفر الإمكانية الجديدة، التي يطلق عليها اسم Act-One، ضمن أحدث نموذج لغة كبير Gen-3 Alpha للشركة (LLM) ويقال إنها تلتقط تعبيرات الوجه بدقة من مقطع فيديو مصدر ثم تعيد إنتاجها على شخصية تم إنشاؤها بواسطة الذكاء الاصطناعي في مقطع فيديو. تعمل هذه الميزة على حل مشكلة كبيرة في تقنية إنشاء الفيديو بالذكاء الاصطناعي والتي تتمثل في تحويل الأشخاص الحقيقيين إلى شخصيات ذكاء اصطناعي دون فقدان التعبيرات الواقعية.

تم تقديم قدرة Runway Act-One في Gen-3 Alpha

في أ مشاركة مدونة، قامت شركة الذكاء الاصطناعي بتفصيل القدرة الجديدة على توليد الفيديو. ذكر Runway أن أداة Act-One يمكنها إنشاء محتوى مباشر ومحتوى متحرك باستخدام عروض الفيديو والصوت كمدخلات. تهدف الأداة إلى تقديم أداء معبر للشخصية في مقاطع الفيديو التي تم إنشاؤها بواسطة الذكاء الاصطناعي.

لقد غيرت مقاطع الفيديو التي تم إنشاؤها بواسطة الذكاء الاصطناعي عملية إنشاء محتوى الفيديو بشكل كبير حيث يمكن للأفراد الآن إنشاء مقاطع فيديو محددة باستخدام المطالبات النصية باللغة الطبيعية. ومع ذلك، هناك بعض القيود التي حالت دون التكيف مع هذه التكنولوجيا. أحد هذه القيود هو عدم وجود ضوابط لتغيير تعبيرات الشخصية في الفيديو أو تحسين أدائها من حيث نطق الجملة والإيماءات وحركة العين.

ومع ذلك، مع Act-One، تحاول Runway سد هذه الفجوة. تعمل الأداة، التي تعمل فقط مع نموذج Gen-3 Alpha، على تبسيط عملية الرسوم المتحركة للوجه، والتي غالبًا ما تكون معقدة وتتطلب سير عمل متعدد الخطوات. اليوم، يتطلب تحريك مثل هذه الشخصيات تسجيل مقاطع فيديو للفرد من زوايا متعددة، وتزوير الوجه يدويًا، والتقاط حركة وجهه بشكل منفصل.

تدعي Runway أن Act-One يحل محل سير العمل ويحوله إلى عملية من خطوتين. يمكن للمستخدمين الآن تسجيل مقطع فيديو لأنفسهم أو لممثل من كاميرا أحادية النقطة، والتي يمكن أن تكون أيضًا هاتفًا ذكيًا، واختيار شخصية تعمل بالذكاء الاصطناعي. بمجرد الانتهاء من ذلك، يُزعم أن الأداة لا تلتقط بأمانة تعبيرات الوجه فحسب، بل تلتقط أيضًا التفاصيل الصغيرة مثل حركات العين والتعبيرات الدقيقة بالإضافة إلى أسلوب التسليم.

ولتسليط الضوء على نطاق هذه الميزة، ذكرت الشركة في منشور المدونة، “يحافظ النموذج على تعبيرات الوجه الواقعية ويترجم الأداء بدقة إلى شخصيات بنسب مختلفة عن الفيديو المصدر الأصلي. يفتح هذا التنوع إمكانيات جديدة لتصميم الشخصيات والرسوم المتحركة المبتكر.

والجدير بالذكر أنه في حين يمكن استخدام Act-One لشخصيات الرسوم المتحركة، فإنه يمكن استخدامه أيضًا لشخصيات الحركة الحية في تسلسل سينمائي. علاوة على ذلك، يمكن للأداة أيضًا التقاط التفاصيل حتى لو كانت زاوية وجه الممثل مختلفة عن زاوية وجه شخصية الذكاء الاصطناعي.

يتم حاليًا طرح هذه الميزة لجميع المستخدمين تدريجيًا، ومع ذلك، نظرًا لأنها تعمل فقط مع Gen-3 Alpha، سيحصل الأشخاص الموجودون في الطبقة المجانية على عدد محدود من الرموز المميزة لإنشاء مقاطع فيديو باستخدام هذه الأداة.



مصدر

LEAVE A REPLY

Please enter your comment!
Please enter your name here