هوش مصنوعی فوق پیشرفته Sora حتی بازیها را هم رندر میکند
جدیدترین پروژهی OpenAI یعنی مدل هوش مصنوعی سورا (Sora) میتواند شاهکارهای سینمایی فوقالعادهای را خلق کند. این مدل حتی از انتظارات OpenAI هم توانمندتر ظاهر شده است.
براساس مقالهی فنی که OpenAI منتشر کرده، سورا میتواند ویدیوهایی با وضوح حداکثر 1080p تولید کند. این هوش مصنوعی قادر است طیف وسیعی از وظایف ویرایش تصویر و ویدئو را انجام دهد؛ از ایجاد ویدئوهای لوپ و جلوبردن و عقبکشیدن زمان ویدیو تا تغییر پسزمینهی ویدئویی که خود کاربر آن را از قبل فیلمبرداری کرده است.
جذابترین نکته، توانایی سورا در شبیهسازی جهانهای دیجیتالی است. در یک آزمایش، OpenAI به سورا دستوراتی حاوی کلمهی Minecraft داد و از آن خواست تا یک HUD و بازیِ متقاعدکننده مانند Minecraft بسازد و فیزیک مشابه آن را ارائه دهد و همزمان شخصیت بازیکن را کنترل کند.
براساس مشاهدات جیم فان، محقق ارشد انویدیا، سورا بیشتر از اینکه هوش مصنوعی مولد باشد، یک موتور فیزیکی دادهمحور است. سورا تنها عکس یا ویدئو تولید نمیکند، بلکه فیزیک هر شیء را در یک محیط تعیین و یک عکس یا ویدئو (یا یک جهان سهبعدیِ تعاملی) را براساس دستورات کاربر رندر میکند.
محققان OpenAI مینویسند: «این قابلیتها نشان میدهد که مقیاسپذیریِ مداومِ مدلهای ویدئویی، مسیر امیدوارکنندهای به سمت توسعهی شبیهسازهای بسیار توانمند دنیاهای فیزیکی و دیجیتالی است که در آن اشیاء، حیوانات و کاربران میتوانند زندگی کنند.»
درحالحاضر، محدودیتهای معمولِ سورا در حوزهی بازیهای ویدیویی خلاصه میشود. این مدل نمیتواند بهطور دقیق فیزیک برهمکنشهای پایه مانند خرد شدن شیشه را تخمین بزند. سورا حتی تعاملات را اغلب بهطور متناقض نمایش میدهد؛ برای مثال فردی را در حال خوردن برگر مدلسازی کرده است اما نمیتواند محل گاز گرفتن روی برگر را رندر کند.
به نظر میرسد که سورا میتواند راه را برای بازیهای واقع گرایانهتر و شاید حتی فوتورئالیستی از توصیفات متنی کاربران هموار کند. این همان بخش هیجانانگیز و ترسناک هوش مصنوعی است (برای مثال خطرات دیپ فیک را در نظر بگیرید) و احتمالاً به همین دلیل است که OpenAI تصمیم گرفته تا دسترسی به سورا را بسیار محدود نگه دارد.
نظرات