هوش مصنوعی علی‌بابا عکس‌های شما را به ویدیوهایی حیرت‌انگیز تبدیل می‌کند [تماشا کنید]

پنج‌شنبه ۱۷ اسفند ۱۴۰۲ - ۱۹:۰۰
مطالعه 2 دقیقه
علی بابا چین
علی بابا از هوش مصنوعی جدید خود با نام AtomoVideo رونمایی کرد.
تبلیغات

تیم تحقیقاتی شرکت چینی علی‌بابا از یک مدل هوش مصنوعی برای تبدیل تصاویر به ویدئو رونمایی کرده که AtomoVideo نام دارد. این تیم، مقالات و نمونه‌هایی از تبدیل تصویر به ویدیو توسط AtomoVideo را به‌همراه نمونه‌هایی از نتایج هوش‌های مصنوعی‌ نسل دوم Runway و همچنین نسل اول Pika به‌اشتراک گذاشته است.

مقایسه تصاویر ساخته شده توسط هوش مصنوعی‌های AtomoVideo با Pika و Gen-2
عکاس: Alibab / Alibaba

نمونه‌های ارائه‌شده‌ی AtomoVideo با توجه به‌ اینکه یک محصول نسل اول است، امیدوارکننده به‌نظر می‌رسند، هرچند که چندان واقع‌گرایانه نیستند. جالب اینجا است که مقایسه‌ی آن‌ها با مدل نسل دوم Runway (نسل اول در اوایل ۲۰۲۳ منتشر شد) نشان می‌دهد که این مدلِ تازه‌رونمایی‌شده نتایج بهتری در کاهش برخی تغییرات عجیب و غریب بین فریم‌ها ارائه داده است.

از ویژگی‌های AtomoVideo می‌توان به توانایی بالای آن در حفظ وفاداری به تصویر ورودی، حرکت روان کاراکترها و پیش‌بینی فریم‌های بعدی اشاره کرد. علاوه‌بر این، AtomoVideo با مدل‌های مختلف T2I (متن به تصویر) سازگار است و قابلیت کنترل معنایی بالایی را ارائه می‌دهد. این قابلیت به کاربران اجازه می‌دهد محتوای ویدئویی را بر اساس اولویت‌های خاص خود شخصی‌سازی کنند.

AtomoVideo با استفاده از مدل‌های از‌پیش‌آموزش‌دیده‌ی T2I و تقویت آن‌ها با ماژول‌های انحراف فضا-زمانیِ تک‌بعدی و ماژول‌های توجه، توانسته به چنین عملکرد قابل‌توجهی دست یابد. این لایه‌های اضافی AtomoVideo را قادر می‌سازد تا جزئیات و سبک‌های پیچیده را ثبت و در عین حال ثبات زمانی را در سراسر ویدئوها تضمین کند.

با وجود قابلیت‌های چشمگیر AtomoVideo، تیم تحقیقاتی هنوز نتوانسته بستری آنلاین برای تجربه‌ی شخصی کاربران فراهم کند. بااین‌حال، مدل هوش مصنوعی AtomoVideo علی‌بابا نشان‌دهنده‌ی یک پیشرفت قابل توجه در زمینه تبدیل تصویر به ویدئو است.

مقاله رو دوست داشتی؟
نظرت چیه؟
داغ‌ترین مطالب روز
تبلیغات

نظرات