هوش مصنوعی جنجالی Sora امروز در دسترس قرار می‌گیرد؛ پروژه جدید خالق ChatGPT

دوشنبه ۱۹ آذر ۱۴۰۳ - ۲۳:۵۷
مطالعه 3 دقیقه
هوش مصنوعی Sora
مبدل هوش مصنوعی متن به ویدئو Sora به‌صورت عمومی اما محدود در دسترس قرار گرفته است.
تبلیغات

خالق ChatGPT اعلام کرد که نسخه‌ی جدیدی از سورا با نام Sora Turbo را به‌عنوان یک محصول مستقل در Sora.com برای کاربران ChatGPT Plus و ChatGPT Pro منتشر کرده است. این نسخه به‌طور قابل‌توجهی سریع‌تر از مدل اولیه‌ای محسوب می‌شود که در فوریه‌ (بهمن ۱۴۰۲) به نمایش در آمد.

به‌گفته‌ی OpenAI، کاربران می‌توانند ویدیوهایی با وضوح تا 1080p، با مدت حداکثر ۲۰ ثانیه و در نسبت‌های ابعادی عریض، عمودی یا مربعی تولید کنند. هوش مصنوعی مولد ویدئو OpenAI می‌تواند با قابلیت Remix، ویدیوهایی که به آن داده می‌شود را متناسب با درخواست کاربر تغییر دهد، دو صحنه‌ی متفاوت را در یکدیگر ادغام کند یا کلیپ‌های جدیدی را از روی عکس یا توصیف متنی بیافریند.

سورا علاوه‌بر تولید کلیپ‌های مجزا، ویژگی داستان‌نویسی (Storyboard) دارد که به کاربر اجازه می‌دهد ویدیویی شامل صحنه‌های مختلف را به‌وسیله‌ی پرامپت‌های سریالی خود تولید کند.

در صفحه‌ی اصلی وبسایت سورا، ویدئوهای تازه‌تولیدشده و منتخبی از فیدهای Featured و Recent نشان داده می‌شوند که به‌طور مداوم با آثار تولیدکنندگان به‌روز می‌شوند. ویدئوهای موجود در صفحه‌ی اصلی سورا می‌توانند برای مشاهده‌ی بعدی با برچسب Saved علامت‌گذاری و در پوشه‌ها سازمان‌دهی شوند. با کلیک روی هر ویدیو می‌توان دید که از چه پرامپتی برای ایجاد آن استفاده شده‌ است.

OpenAI می‌گوید که مشترکان حساب Plus در ChatGPT می‌توانند بدون پرداخت هزینه‌ی اضافی از سورا استفاده کنند و تا ۵۰ ویدیوی پنج ثانیه‌ای با وضوح تا 720p در هر ماه بسازند.

اشتراک ۲۰۰ دلاری ChatGPT Pro امکان تولید ۵۰۰ ویدیوی ۲۰ ثانیه‌ای تا وضوح 1080p در هر ماه را می‌دهد و کاربر می‌توان ویدیو را بدون واترمارک دانلود کند و به‌طور همزمان پنج ویدیو بسازد. OpenAI هم‌اکنون روی قیمت‌گذاری متناسبی برای کاربران مختلف کار می‌کند و قصد دارد اوایل ۲۰۲۵ آن را در دسترس قرار دهد.

خالق ChatGPT اذعان کرد که نسخه‌ی فعلی سورا محدودیت‌های زیادی دارد. این مدل اغلب حالت‌های فیزیکی غیرواقعی تولید می‌کند و در انجام اقدامات پیچیده در مدت زمان طولانی دچار مشکل می‌شود. طبق بررسی اولیه‌ی مارکز براونلی، یوتیوبر معروف حوزه‌ی فناوری، در ویدئوهای سورا اشیاء ثبات ندارند و به‌گونه‌ای در مقابل یا پشت یکدیگر حرکت می‌کنند که منطقی نیست و بدون هیچ دلیلی ناپدید و دوباره ظاهر می‌شوند.

تمام ویدیوهای تولید شده توسط سورا دارای متاداده‌ی C2PA هستند که ویدیو را به‌عنوان تولید شده توسط سورا شناسایی می‌کند تا بتوان از آن برای تأیید منبع استفاده کرد. علاوه‌بر این، همه‌ی ویدیوها دارای واترمارک‌ قابل مشاهده خواهند بود و OpenAI ابزاری برای جست‌وجوی داخلی توسعه داده که به‌کمک ویژگی‌های فنی تشخیص می‌دهد که ویدیو را سورا پدید آورده است.

OpenAI خطوط قرمزی را برای جلوگیری از دیپ‌ فیک، تولید محتواهای جنسی و خشونت آمیز، تصاویر افراد زیر ۱۸ سال و پرهیز از بارگذاری یا ایجاد محتوای دارای حق کپی‌رایت مانند نام و لوگو شرکت‌ها درنظر گرفته است. علاوه‌بر این، بارگذاری تصاویر افراد در حال حاضر محدود خواهد بود، اما این ویژگی پس از بهبود تدابیر دیپ‌فیک برای کاربران بیشتری در دسترس قرار می‌گیرد.

مقاله رو دوست داشتی؟
نظرت چیه؟
داغ‌ترین مطالب روز
تبلیغات

نظرات