هوش مصنوعی فوق پیشرفته Sora حتی بازی‌ها را هم رندر می‌کند

جمعه ۲۷ بهمن ۱۴۰۲ - ۱۵:۱۵
مطالعه 2 دقیقه
هوش مصنوعی سورا OpenAI Sora دمو یک زن در توکیو
سورا، جدیدترین پروژه‌ی هوش مصنوعی OpenAI، عملکرد شگفت‌انگیزی در تبدیل متن به ویدیو دارد.
تبلیغات

جدیدترین پروژ‌ه‌ی OpenAI یعنی مدل هوش مصنوعی سورا (Sora) می‌تواند شاهکارهای سینمایی فوق‌العاده‌ای را خلق کند. این مدل حتی از انتظارات OpenAI هم توانمندتر ظاهر شده است.

براساس مقاله‌ی فنی که OpenAI منتشر کرده، سورا می‌تواند ویدیوهایی با وضوح حداکثر 1080p تولید کند. این هوش مصنوعی قادر است طیف وسیعی از وظایف ویرایش تصویر و ویدئو را انجام دهد؛ از ایجاد ویدئوهای لوپ و جلوبردن و عقب‌کشیدن زمان ویدیو تا تغییر پس‌زمینه‌ی ویدئویی که خود کاربر آن را از قبل فیلم‌برداری کرده است.

جذاب‌ترین نکته، توانایی سورا در شبیه‌سازی جهان‌های دیجیتالی است. در یک آزمایش، OpenAI به سورا دستوراتی حاوی کلمه‌ی Minecraft داد و از آن خواست تا یک HUD و بازیِ متقاعدکننده مانند Minecraft بسازد و فیزیک مشابه آن را ارائه دهد و هم‌زمان شخصیت بازیکن را کنترل کند.

اسکرین شات از ویدئویی رندر شده توسط هوش مصنوعی سورا که بازی ویدئویی ماینکرفت را شبیه‌سازی کرده است
شبیه‌سازی ماینکرفت توسط سورا

براساس مشاهدات جیم فان، محقق ارشد انویدیا، سورا بیشتر از این‌که هوش مصنوعی مولد باشد، یک موتور فیزیکی داده‌محور است. سورا تنها عکس یا ویدئو تولید نمی‌کند، بلکه فیزیک هر شیء را در یک محیط تعیین و یک عکس یا ویدئو (یا یک جهان سه‌بعدیِ تعاملی) را براساس دستورات کاربر رندر می‌کند.

محققان OpenAI می‌نویسند: «این قابلیت‌ها نشان می‌دهد که مقیاس‌پذیریِ مداومِ مدل‌های ویدئویی، مسیر امیدوارکننده‌ای به سمت توسعه‌ی شبیه‌سازهای بسیار توانمند دنیاهای فیزیکی و دیجیتالی است که در آن اشیاء، حیوانات و کاربران می‌توانند زندگی کنند.»

درحال‌حاضر، محدودیت‌های معمولِ سورا در حوزه‌ی بازی‌های ویدیویی خلاصه می‌شود. این مدل نمی‌تواند به‌طور دقیق فیزیک برهمکنش‌های پایه مانند خرد شدن شیشه را تخمین بزند. سورا حتی تعاملات را اغلب به‌طور متناقض نمایش می‌دهد؛ برای مثال فردی را در حال خوردن برگر مدل‌سازی کرده است اما نمی‌تواند محل گاز گرفتن روی برگر را رندر کند.

به نظر می‌رسد که سورا می‌تواند راه را برای بازی‌های واقع گرایانه‌تر و شاید حتی فوتورئالیستی از توصیفات متنی کاربران هموار کند. این همان بخش‌ هیجان‌انگیز و ترسناک هوش مصنوعی است (برای مثال خطرات دیپ فیک را در نظر بگیرید) و احتمالاً به همین دلیل است که OpenAI تصمیم گرفته تا دسترسی به سورا را بسیار محدود نگه دارد.

مقاله رو دوست داشتی؟
نظرت چیه؟
داغ‌ترین مطالب روز
تبلیغات

نظرات