تولید ویدیو از روی عکس و متن؛ هوش مصنوعی ویدیویی ادوبی رونمایی شد

دوشنبه 23 مهر 1403 - 18:27

مطالعه 3 دقیقه

ادوبی با ابزارهای ویدیویی هوش مصنوعی جدید، امکان تولید محتوای ویدیویی از متن و تصویر را برای کاربران فراهم کرده است.

تبلیغات

ادوبی سرانجام ابزارهای ویدیویی هوش مصنوعی خود را معرفی کرد. مدل ویدیویی Firefly که از اوایل سال جاری معرفی شد، اکنون در مجموعه‌ای از ابزارهای جدید دردسترس قرار گرفته است. این ابزارها قابلیت‌هایی به نرم‌افزار پریمیر پرو اضافه می‌کنند و به تولیدکنندگان محتوا اجازه می‌دهند تا با دستورهای متنی یا تصاویر، ویدیوهای جدید ایجاد کنند یا مدت ویدیوهای کنونی را افزایش دهند.

یکی از ابزارهای هوش مصنوعی پریمیر پرو با نام Generative Extend به‌صورت آزمایشی ارائه شده است. این ابزار برای گسترش ابتدا یا انتهای ویدیوهایی استفاده می‌شود که به‌اندازه‌ی کافی طولانی نیستند. همچنین، می‌توان از آن برای انجام تغییرات در وسط ویدیو، ازجمله اصلاح جهت نگاه‌ها یا حرکات ناخواسته بهره برد.

هرچند این ابزار فقط می‌تواند ویدیوها را تا دو ثانیه گسترش دهد، برای اصلاحات کوچک مناسب به‌نظر می‌رسد و نیاز به تکرار ضبط برای رفع مشکلات جزئی را برطرف می‌کند. ویدیوهای گسترش‌یافته با وضوح 720p یا 1080p و با نرخ ۲۴ فریم‌برثانیه تولید می‌شوند. این ابزار در بخش صدا نیز کاربرد دارد و می‌تواند جلوه‌های صوتی و صدای محیط را تا ۱۰ ثانیه گسترش دهد؛ اما نمی‌تواند با دیالوگ‌ها یا موسیقی کار کند.

دو ابزار ویدیویی Text-to-Video و Image-to-Video به‌صورت آزمایشی در وب‌اپلیکیشن Firefly دردسترس قرار گرفته‌اند. این ابزارها که برای اولین‌بار در سپتامبر معرفی شدند، اکنون به‌طور محدود برای کاربران قابلیت استفاده دارند. Text-to-Video عملکردی مشابه سایر ابزارهای تولید ویدیو مانند Runway و Sora دارد.

کاربران می‌توانند توضیحات متنی خود را وارد و ویدیو دلخواهشان را ایجاد کنند. این ابزار قابلیت تولید ویدیو در سبک‌های مختلف ازجمله فیلم واقعی و انیمیشن سه‌بعدی و استاپ‌موشن را دارد. کاربران می‌توانند با استفاده از تنظیمات دوربین مواردی زوایای دوربین و حرکت و فاصله‌ی تصویربرداری، ویدیوها را دقیق‌تر کنترل کنند.

ابزار Image-to-Video ادوبی به کاربران اجازه می‌دهد تا علاوه‌بر دستور متنی، از تصویر مرجع برای دریافت بهترین نتیجه استفاده کنند. به‌گفته‌ی ادوبی، می‌توان از این ابزار برای ساخت محتوای اضافی از تصاویر استفاده کرد. درحال‌حاضر، ایرادهای جزئی در عملکرد این ویژگی وجود دارد که احتمالاً در نسخه‌ی نهایی رفع خواهند شد.

هنوز نمی‌توان با ابزارهای هوش مصنوعی جدید ادوبی فیلم‌های بلند ساخت. طول ویدیوهای تولیدشده با Text-to-Video و Image-to-Video حداکثر به ۵ ثانیه می‌رسد و وضوح آن‌ها تا 720p با نرخ ۲۴ فریم‌برثانیه محدود می‌شود. در مقام‌ مقایسه، ابزار Sora با حفظ کیفیت بصری و تطابق با دستورهای کاربر می‌تواند ویدیوهایی با طول حداکثر یک دقیقه بسازد؛ اما این ابزار هنوز برای عموم دردسترس نیست.

مقالات مرتبط:

مدت‌زمان موردنیاز برای تولید ویدیو با ابزارهای Text-to-Video، Image-to-Video و Generative Extend ادوبی حدود ۹۰ ثانیه است. ناگفته نماند که این شرکت در حال توسعه‌ی حالت Turbo است که زمان موردنیاز برای ساخت ویدیوها را کاهش خواهد داد.

براساس اعلام ادوبی، مدل‌های هوش مصنوعی ویدیویی این شرکت برپایه‌ی محتوای مجاز آموزش دیده‌اند که می‌تواند برای برخی کاربران جذاب باشد. مدل‌های دیگر مانند Runway با اتهام استفاده از ویدیوهای یوتیوب برای آموزش مدل‌های خود مواجه هستند.

مزیت دیگر ابزارهای هوش مصنوعی جدید ادوبی این است که ویدیوهای ایجاد‌شده با مدل Firefly می‌توانند با Content Credentials همراه باشند. این ویژگی هنگام انتشار آنلاین محتوا به افشای استفاده از هوش مصنوعی و کپی‌رایت آن محتوا کمک می‌کند.

هنوز نمی‌دانیم ابزارهای جدید ادوبی چه زمانی از مرحله‌ی بتا خارج خواهند شد؛ اما دسترسی عمومی به آن‌ها مزیت بسیار مهمی درمقایسه‌با ابزارهایی مانند Sora و Movie Gen و Veo محسوب می‌شود.

مقاله رو دوست داشتی؟

نظرت چیه؟

مجتبی بوالحسنی

تبلیغات

نظرات