سرویس Stable Video Diffusion عکس را به ویدئو تبدیل می‌کند [تماشا کنید]

چهارشنبه ۱ آذر ۱۴۰۲ - ۲۰:۳۰
مطالعه 2 دقیقه
تصاویر چهار ویدیو‌ی تولید شده با Stable Video Diffusion
نرم‌افزار تحت‌وب جدیدی که شرکت Stability AI به‌زودی منتشر خواهد کرد، می‌تواند از یک عکس ثابت تا ۲۵ فریم ویدئو تولید کند.
تبلیغات

شرکت Stability AI که در‌زمینه‌ی تولیدات هنری مبتنی‌بر هوش مصنوعی فعالیت می‌کند، محصول جدیدی موسوم‌ به Stable Video Diffusion را به‌صورت آزمایشی منتشر کرده است که از روی عکس، ویدئو تولید می‌کند.

Stability AI در صفحه‌ی معرفی این نرم‌افزار نوشت: «این مدل هوش مصنوعی مولد برای ویدئو، گام مهمی در سفر ما به‌سمت ایجاد مدل‌هایی برای کاربردهای متنوع‌تر خواهد بود.»

ابزار جدید به‌صورت دو مبدل تصویر به ویدئو منتشر شده است که هرکدام می‌توانند ۱۴ تا ۲۵ فریم با سرعت ۳ تا ۳۰ فریم‌برثانیه و وضوح ۵۷۶ در ۱۰۲۴ پیکسل تولید کنند. افزون‌براین، این مدل هوشمند می‌تواند چندین نما از یک فریم واحد را خلق کند.

در‌حال‌حاضر، Stable Video Diffusion فقط برای اهداف تحقیقاتی دردسترس است، نه کاربردهای معمولی یا تجاری. علاقه‌مندان می‌توانند برای دسترسی به نرم‌افزار تحت‌وب تبدیل متن و عکس به ویدئو، در وب‌سایت شرکت ثبت‌نام کنند و به فهرست انتظار بپیوندند. این ابزار کاربردهای بالقوه‌ای در تبلیغات، آموزش، سرگرمی و... خواهد داشت.

نمونه‌هایی که در ویدئو بالا نشان داده شده‌اند، کیفیت نسبتاً مناسبی در‌مقایسه‌با رقبا دارند. با‌این‌حال، توسعه‌دهندگان می‌گویند: «این مدل محدودیت‌هایی دارد؛ از‌جمله اینکه ویدئوهای نسبتاً کوتاه (کمتر از چهار ثانیه) تولید می‌کند، واقع‌گرایی کاملی ندارد، فاقد امکان حرکت دوربین به‌جز حرکت‌های کُند است، کنترلی روی متن ندارد، متن تولید‌شده خواندنی نیست و ممکن است افراد و چهره‌ها را به‌درستی تولید نکند.

این ابزار روی دیتابیسی از میلیون‌ها ویدئو آموزش دیده و سپس روی مجموعه‌ی کوچک‌تری تنظیم شده و از ویدئوهایی استفاده کرده است که برای اهداف تحقیقاتی به‌صورت عمومی در‌دسترس بودند. منابع دیتابیس بسیار مهم هستند؛ زیرا به‌تازگی شرکت Stability AI به‌دلیل استفاده از آرشیو تصاویر شرکت Getty Images به دادگاه فراخوانده شده است.

ویدئو یکی از اهداف اصلی هوش مصنوعی مولد است؛ زیرا قابلیت مطلوبی در ساده‌کردن تولید محتوا دارد. با‌این‌حال، بیشترین احتمال سوء‌استفاده در تولید ویدئو‌های جعلی، نقض کپی‌رایت و... هم دارد.

بر‌خلاف OpenAI و ChatGPT، شرکت Stability توفیق کمتری در تجاری‌سازی Stable Diffusion داشته و با بدهی سنگینی مواجه شده است. هفته‌ی گذشته نیز، اد نیوتن‌رکس، معاون صدا در شرکت Stability AI، به‌دلیل استفاده از محتوای دارای حق کپی‌رایت برای آموزش مدل‌های هوش مصنوعی مولد استعفا داد.

مقاله رو دوست داشتی؟
نظرت چیه؟
داغ‌ترین مطالب روز
تبلیغات

نظرات