ساخت ویدئو با دستور متنی؛ انقلاب جدید هوش مصنوعی از راه رسید

فناوری

ویدیو

دوشنبه ۲۹ اسفند ۱۴۰۱ - ۲۰:۴۰

مطالعه 3 دقیقه

مبین احمدی

یکی از استارتاپ‌ها ابزار جدیدی معرفی کرده است که ساخت ویدئو را ازطریق دستور متنی امکان‌پذیر می‌کند.

تبلیغات

امروزه، بسیاری از مردم مشغول استفاده از ابزارهای هوش مصنوعی تبدیل متن به عکس هستند. با‌این‌حال، ابزارهای تبدیل متن به ویدئو هنوز به‌صورت گسترده از راه نرسیده‌اند. چنین سیستم‌هایی به شما امکان می‌دهند صحنه‌ی مدنظر خود را در قالب متن توصیف و نتیجه‌ را به‌صورت ویدئو از هوش مصنوعی دریافت کنید.

استارتاپی به نام Runway ابزار هوش مصنوعی جدیدی معرفی کرده است که رؤیای تولید ویدئو براساس متن را محقق می‌کند.

Runway ابزاری مبتنی‌بر وب دارد که مخصوص ویرایش فایل‌های ویدئویی است و می‌تواند کارهایی مثل حذف پس‌زمینه را انجام دهد. این شرکت به توسعه‌ی مدل هوش مصنوعی متن‌باز Stable Diffusion کمک کرد و ماه گذشته سراغ رونمایی اولین مدل هوش مصنوعی برای ویرایش ویدئو با نام Gen-1 رفت.

ابزار Gen-1 روی ویرایش فایل‌های ویدئویی ضبط‌شده تمرکز دارد و به کاربران امکان می‌دهد انیمیشن سه‌بعدی یا ویدئو ضبط‌شده با گوشی را ازطریق هوش مصنوعی اصلاح کنند. برای نمونه، در تصویر بالا ویدئو ضبط‌شده از یک مقوا و چند آیتم دیگر با تصویر کارخانه‌ای صنعتی ترکیب شده است.

نمای نزدیک چشم ساخت هوش مصنوعی — ویدئو خلق‌شده با هوش مصنوعی Gen-2 از روی متن «نمای نزدیک یک چشم»

ابزار جدید Gen-2 روی تولید ویدئو متمرکز است؛ البته این ابزار فعلاً نقص‌هایی دارد؛ مثلاً کلیپ‌های منتشرشده‌ی استارتاپ Runway بسیار کوتاه‌ و ناپایدار و غیرواقعی‌اند و دسترسی به این ابزار نیز محدود است.

به‌گزارش ورج، کاربران موظف‌اند برای حضور در فهرست انتظار ثبت‌نام کنند. سخن‌گوی Runway به ورج گفته است که ابزار هوش مصنوعی جدید در هفته‌های آینده به‌صورت گسترده دردسترس می‌گیرد.

نمای کوهستان ساخت هوش مصنوعی — ویدئو خلق‌شده با هوش مصنوعی Gen-2 از روی متن «شات هوایی از منظره‌ای کوهستانی»

با وجود تمامی نقص‌ها، ویدئوهایی که هوش مصنوعی Gen-2 صرفاً از روی متن می‌سازد، شگفت‌انگیزند؛ البته ابزارهای تبدیل متن به ویدئو در عین جذاب‌بودن، می‌توانند نشر اخبار جعلی را افزایش دهند.

نمای غروب آفتاب ساخت هوش مصنوعی — ویدئو خلق‌شده با هوش مصنوعی Gen-2 از روی متن «غروب آفتاب از پنجره‌ای در داخل آپارتمانی در نیویورک»

این نخستین‌باری نیست که ابزارهای تبدیل متن به ویدئو را می‌بینیم؛‌ زیرا متا و گوگل نیز پیش‌تر چنین ابزارهایی را به‌نمایش گذاشته‌اند. آنچه این دو شرکت نمایش دادند، شامل ویدئوهایی طولانی‌تر و منسجم‌تر بود. فراموش نکنید گوگل و متا کارمندان پرتعدادی دارند؛ اما استارتاپ Runway شامل تیمی ۴۵ نفره است.

مقاله رو دوست داشتی؟

نظرت چیه؟

مبین احمدی

داغ‌ترین مطالب روز

نظرات