تولید ویدیو از روی عکس و متن؛ هوش مصنوعی ویدیویی ادوبی رونمایی شد
ادوبی سرانجام ابزارهای ویدیویی هوش مصنوعی خود را معرفی کرد. مدل ویدیویی Firefly که از اوایل سال جاری معرفی شد، اکنون در مجموعهای از ابزارهای جدید دردسترس قرار گرفته است. این ابزارها قابلیتهایی به نرمافزار پریمیر پرو اضافه میکنند و به تولیدکنندگان محتوا اجازه میدهند تا با دستورهای متنی یا تصاویر، ویدیوهای جدید ایجاد کنند یا مدت ویدیوهای کنونی را افزایش دهند.
یکی از ابزارهای هوش مصنوعی پریمیر پرو با نام Generative Extend بهصورت آزمایشی ارائه شده است. این ابزار برای گسترش ابتدا یا انتهای ویدیوهایی استفاده میشود که بهاندازهی کافی طولانی نیستند. همچنین، میتوان از آن برای انجام تغییرات در وسط ویدیو، ازجمله اصلاح جهت نگاهها یا حرکات ناخواسته بهره برد.
هرچند این ابزار فقط میتواند ویدیوها را تا دو ثانیه گسترش دهد، برای اصلاحات کوچک مناسب بهنظر میرسد و نیاز به تکرار ضبط برای رفع مشکلات جزئی را برطرف میکند. ویدیوهای گسترشیافته با وضوح 720p یا 1080p و با نرخ ۲۴ فریمبرثانیه تولید میشوند. این ابزار در بخش صدا نیز کاربرد دارد و میتواند جلوههای صوتی و صدای محیط را تا ۱۰ ثانیه گسترش دهد؛ اما نمیتواند با دیالوگها یا موسیقی کار کند.
دو ابزار ویدیویی Text-to-Video و Image-to-Video بهصورت آزمایشی در وباپلیکیشن Firefly دردسترس قرار گرفتهاند. این ابزارها که برای اولینبار در سپتامبر معرفی شدند، اکنون بهطور محدود برای کاربران قابلیت استفاده دارند. Text-to-Video عملکردی مشابه سایر ابزارهای تولید ویدیو مانند Runway و Sora دارد.
کاربران میتوانند توضیحات متنی خود را وارد و ویدیو دلخواهشان را ایجاد کنند. این ابزار قابلیت تولید ویدیو در سبکهای مختلف ازجمله فیلم واقعی و انیمیشن سهبعدی و استاپموشن را دارد. کاربران میتوانند با استفاده از تنظیمات دوربین مواردی زوایای دوربین و حرکت و فاصلهی تصویربرداری، ویدیوها را دقیقتر کنترل کنند.
ابزار Image-to-Video ادوبی به کاربران اجازه میدهد تا علاوهبر دستور متنی، از تصویر مرجع برای دریافت بهترین نتیجه استفاده کنند. بهگفتهی ادوبی، میتوان از این ابزار برای ساخت محتوای اضافی از تصاویر استفاده کرد. درحالحاضر، ایرادهای جزئی در عملکرد این ویژگی وجود دارد که احتمالاً در نسخهی نهایی رفع خواهند شد.
هنوز نمیتوان با ابزارهای هوش مصنوعی جدید ادوبی فیلمهای بلند ساخت. طول ویدیوهای تولیدشده با Text-to-Video و Image-to-Video حداکثر به ۵ ثانیه میرسد و وضوح آنها تا 720p با نرخ ۲۴ فریمبرثانیه محدود میشود. در مقام مقایسه، ابزار Sora با حفظ کیفیت بصری و تطابق با دستورهای کاربر میتواند ویدیوهایی با طول حداکثر یک دقیقه بسازد؛ اما این ابزار هنوز برای عموم دردسترس نیست.
مدتزمان موردنیاز برای تولید ویدیو با ابزارهای Text-to-Video، Image-to-Video و Generative Extend ادوبی حدود ۹۰ ثانیه است. ناگفته نماند که این شرکت در حال توسعهی حالت Turbo است که زمان موردنیاز برای ساخت ویدیوها را کاهش خواهد داد.
براساس اعلام ادوبی، مدلهای هوش مصنوعی ویدیویی این شرکت برپایهی محتوای مجاز آموزش دیدهاند که میتواند برای برخی کاربران جذاب باشد. مدلهای دیگر مانند Runway با اتهام استفاده از ویدیوهای یوتیوب برای آموزش مدلهای خود مواجه هستند.
مزیت دیگر ابزارهای هوش مصنوعی جدید ادوبی این است که ویدیوهای ایجادشده با مدل Firefly میتوانند با Content Credentials همراه باشند. این ویژگی هنگام انتشار آنلاین محتوا به افشای استفاده از هوش مصنوعی و کپیرایت آن محتوا کمک میکند.
هنوز نمیدانیم ابزارهای جدید ادوبی چه زمانی از مرحلهی بتا خارج خواهند شد؛ اما دسترسی عمومی به آنها مزیت بسیار مهمی درمقایسهبا ابزارهایی مانند Sora و Movie Gen و Veo محسوب میشود.
نظرات