هوش مصنوعی به‌زودی ویدئوهایمان را هم ویرایش خواهد کرد

دوشنبه ۲۱ شهریور ۱۴۰۱ - ۱۳:۰۰
مطالعه 2 دقیقه
شرکتی به‌نام Runway در ویديویی تبلیغاتی از پروژه‌ای مبتنی بر هوش مصنوعی رونمایی کرد که تمام فرایند ویرایش ویدیو را تنها با تایپ درخواست در کادر متنی انجام می‌دهد.
تبلیغات

هنوز از شوک Dall-E بیرون نیامده بودیم که حالا خبردار شدیم شرکتی آمریکایی به‌نام Runway که نسخه‌ی وب ابزار ویرایش ویدئو را به‌طور رایگان و همچنین با اشتراک سالانه ۳۵ دلاری دراختیار کاربران قرار می‌دهد، پروژه‌ای در دست توسعه دارد که به‌کمک آن می‌توانید ویدئوهایتان را به‌سادگی نوشتن کاری که می‌خواهید انجام دهید، ویرایش کنید.

در ویدویی که شرکت هوش مصنوعی Runway در توییتر منتشر کرد، قابلیت جدیدی از ویرایشگر ویدئوی آن به نمایش گذاشته شد که به کاربر اجازه می‌دهد به‌جای استفاده از ابزارهای مختلف ویرایش، تنها با تایپ کردن درخواست خود در کادر متنی، از هوش مصنوعی برای انجام ویرایش کمک بگیرد.

به‌عبارت دیگر، درحالی‌که هوش مصنوعی DALL-E کار فتوشاپ را برای ما انجام می‌دهد، پروژه‌ی Runway درصورت تکمیل شدن، کار ویرایش ویدئو را انجام خواهد داد و دیگر نیازی به دانش Adobe Premiere یا Final Cut نخواهد بود.

در ویدئوی «تبدیل متن به ویدیو» Runway کادری را می‌بینیم که در آن دستورهای مربوط به ویرایش نوشته و بلافاصله اجرا می‌شود؛ از‌جمله «ویدئوی خیابان شهری را ایمپورت کن» (به‌جای کلیک کردن روی گزینه‌ی Import و انتخاب دستی ویدئو)، «آن را سینمایی‌تر کن» (به‌جای اضافه کردن دستی افکت موردنظر) یا «این شیء را حذف کن» (چراغ راهنمایی انتخاب‌شده، ناپدید می‌شود). این ویدئوی تبلیغاتی همچنین قابلیتی شبیه تبدیل متن به تصویر مشابه Dall-E، اضافه کردن متن به ویدئو، انتخاب سوژه‌ی ویدئو و اعمال افکت روی پس‌زمینه را نشان می‌دهد که در صورت محقق شدن، فرایند ویرایش ویدئو را برای افرادی که کوچک‌ترین دانشی در این زمینه ندارند، به‌شدت آسان خواهد کرد.

درحال‌حاضر، مولد ویدئو مبتنی بر هوش مصنوعی که گاهی از آن به‌عنوان «text2video» یاد می‌شود، به‌خاطر نیاز به رایانش کامپیوتری سنگین و نبود مدل‌های آموزش یادگیری ماشین برای ویدئو در مرحله‌ی ابتدایی قرار دارد. یکی از آینده‌دارترین مدل‌های «text2video» که دردسترس عموم قرار دارد، CogVideo است که می‌تواند ویدئوهای ساده با وضوح بسیار پایین و افت شدید نرخ فریم تولید کند. این مدل که در وب‌سایت huggingface میزبانی می‌شود، درحال‌حاضر تنها با درخواست‌های متنی به زبان چینی کار می‌کند و زمان پردازش ویدئو بسیار طولانی است. با‌این‌حال، باید توجه داشت که مدل‌های مولد تصویر نیز تا همین سال گذشته بسیار ابتدایی بودند و می‌توان امیدوار بود که کیفیت مولد‌های ویدئو تا چند سال دیگر بهبود چشمگیری پیدا کند.

افرادی که مایل‌اند در فاز آزمایشی «تبدیل متن به ویدئو» Runway شرکت کنند، می‌توانند در وب‌سایت این شرکت ثبت‌نام کرده و به فهرست انتظار آن ملحق شوند.

مقاله رو دوست داشتی؟
نظرت چیه؟
داغ‌ترین مطالب روز
تبلیغات

نظرات