از راکون کتابخوان تا شیر موجسوار؛ این ویدئوی حیرتانگیز کار هوش مصنوعی است
گوگل از جدیدترین مدل هوش مصنوعی مولد ویدئوی خود موسومبه Lumiere رونمایی کرد. غول جستوجوی اینترنت میگوید Lumiere پیشرفت بسیار چشمگیری در ساخت ویدئو محسوب میشود زیرا حرکت واقعی، متنوع و منسجم، همیشه یکی از چالشهای اصلی ساخت ویدیو با هوش مصنوعی بوده که در مدل جدید رفع شده است.
هوش مصنوعی جدید گوگل عملکرد بسیار خوبی از خود نشان میدهد. کاربران میتوانند فقط با نوشتن پیام متنی، ارائهی ویدئوی منبع یا استفاده از تصویر مرجع بهعنوان سبک موردنظر خود، کلیپ ویدئویی کاملاً جدیدی بسازند.
Lumiere از معماری U-Net استفاده میکند؛ فناوری پیشرفتهای که کلیپ ویدئویی را بهصورت یکجا با کیفیت بالا و با بهرهگرفتن از هوش مصنوعی تولید میکند. این درحالی است که مدلهای موجود از ترکیب فریمهای کلیدی متفاوت برای ایجاد ویدئو بهره میبرند.
از دیگر ویژگیهای Lumiere میتوان به امکان انتخاب سبک ویدئو اشاره کرد. مدل هوش مصنوعی گوگل میتواند با بررسی دقیق ویدئوی منبع و تصاویر مرجع، ویدئوی جدیدی براساس آنها ایجاد کند. ویژگی Video Inpainting نیز میتواند بخشهایی از ویدئوی منبع ازجمله رنگ یا بافتها را تغییر دهد.
در مقالهی رسمی گوگل آمده است Lumiere توانایی ایجاد ویدئوهایی با وضوح ۱۰۲۴ در ۱۰۲۴ پیکسل را با طول پنج ثانیه دارد. درمقام مقایسه، برخی مدلهای مشابه قبلی میتوانند ویدئوهای طولانیتر با وضوح بالاتر بسازند.
گوگل میگوید کاربران، خروجی Lumiere را به سایر مدلها ترجیح خواهند داد. این شرکت ادعا میکند مدل هوش مصنوعی جدیدش روی مجموعه دادههایی شامل ۳۰ میلیون ویدئو بههمراه توضیحات متنی آنها آموزش دیده است.
مقالهی محققان گوگل بر تأثیر اجتماعی فناوری هوش مصنوعی مولد ویدئو مثل Lumiere تأکید دارد و بیان میکند هدف اصلی مدل مذکور، ارائهی روشی آسان برای کاربران مبتدی است تا بتوانند ایدههایشان را بهراحتی و با خلاقیت بالا به ویدئو تبدیل کنند.
نظرات