D1-kifpool
هوش مصنوعی Sora

هیاهوی هوش مصنوعی مولد ویدیو Sora؛ کابوس صنعت فیلم‌سازی؟

سه‌شنبه ۱۵ اسفند ۱۴۰۲ - ۱۰:۰۰
مطالعه 11 دقیقه
هوش مصنوعی Sora با تبدیل متن به ویدیوهای شگفت‌انگیز، در اینترنت غوغا به‌پا کرده است؛ آیا چند وقت دیگر هوش مصنوعی صنعت فیلم‌سازی را هم تسخیر می‌کند؟
تبلیغات
D4-mci

اردیبهشت امسال، استارتاپی نیویورکی به نام Runaway AI از تکنولوژی جدید و پیشرفته‌ای برای تبدیل متن به ویدیوهای چهار ثانیه‌ای رونمایی کرد. ویدیوهای تولیدشده توسط هوش مصنوعی Runaway در ابتدا چندان باکیفیت و شفاف نبودند، اما دستیابی بشر به چنین فناوری پیچیده‌ای، از پیشرفت سریع هوش مصنوعی مولد در ماه‌های آتی خبر می‌داد.

تا اینکه چند وقت پیش شرکت OpenAI، خالق ChatGPT، در بیانیه‌ای غیرمنتظره از مهم‌ترین مدل هوش مصنوعی مولد سال ۲۰۲۴ به‌نام Sora رونمایی کرد. «سورا» می‌تواند با استفاده از دستورات متنی یا یک تصویر ثابت، ویدیوهای حداکثر یک‌دقیقه‌ای را با صحنه‌هایی واقع‌گرایانه، کیفیت بالا و ابعاد و وضوح مختلف خلق کند.

طبق بیانیه مطبوعاتی OpenAI، «مدل مولد Sora با درک عمیقی که از زبان انسان دارد، قادر به خلق صحنه‌های پیچیده، کاراکترهای انسانی و پس‌زمینه‌ی با جزئیات بالا است. این مدل نه‌تنها درک عمیقی نسبت به دستورات متنی و ویدیوی مورد نظر کاربر دارد، بلکه نحوه‌ی تعامل اشیاء و المان‌های مختلف در دنیای واقعی را هم خیلی خوب می‌داند.»

«Sora» در واقع یک واژه‌ی ژاپنی به معنای «آسمان» است. تیم بروکس و بیل پیبلس، از اعضای تیم توسعه‌دهنده‌ی هوش مصنوعی جدید OpenAI می‌گویند «Sora تداعی‌کننده‌ی دنیای بی‌حدومرز خلاقیت است.»

اگرچه با کمی دقت در دموهای منتشرشده می‌توان فهمید که این ویدیوها توسط هوش مصنوعی ساخته شده‌اند، نتایج کلی بسیار جذاب و چشم‌نواز هستند و برخی کاربران، آن را «چیزی فراتر از این جهان» توصیف کرده‌اند.

کپی لینک

ویدیوهای خلق‌شده توسط Sora

در حال حاضر امکان ارسال فرامین شخصی به مدل Sora وجود ندارد، اما با مراجعه به وب‌سایت OpenAI می‌توانید تعداد زیادی از ویدیوهای تولیدشده توسط Sora را مشاهده کنید. این شرکت می‌گوید ویدیوها را بدون اعمال هیچ‌گونه تغییراتی در وب‌سایتش منتشر کرده است.

ویدیوی زیر، نمای بی‌نظیری از شهر توکیو در یک روز برفی و پراکندگی شکوفه‌های گیلاس و دانه‌های برف در هوا را نشان می‌دهد. به نظر می‌رسد دوربین [مجازی] روی یک پهپاد نصب شده و زوجی را در حال قدم‌زدن در پیاده‌رو دنبال می‌کند. در سمت چپ پیاده‌رو، خیابانی ماشین‌رو و در سمت راست، مغازه‌های کوچکی را می‌بینیم.

کپشن ویدیو: یک روز زیبای برفی در شهر مملو از جمعیت توکیو. دوربین از بین خیابان شلوغ شهر عبور می‌کند و مردمی که در حال لذت‌بردن از هوای برفی یا خرید از فروشگاه‌های کنار خیابان هستند را نشان می‌دهد. شکوفه‌های گیلاس و دانه‌های برف در هوا پراکنده هستند.

با نگاه چندباره به این ویدیو متوجه نقص‌های جزئی آن خواهید شد. برای مثال، به نظر می‌رسد انتهای پیاده‌رو بسته است و زوجی که دوربین آن‌ها را دنبال می‌کند، برای ادامه‌ی مسیرشان باید به آن طرف گاردریل عجیب موجود در پیاده‌رو بروند. یا وقتی به ماشین‌ها و شاخه‌های درخت گیلاس نگاه کنید، متوجه محوشدن ماشین‌ها و معلق‌بودن بعضی شاخه‌ها در هوا خواهید شد. با صرف‌نظر از این موارد، ویدیوی بالا واقعاً چشم‌نواز و حیرت‌انگیز است.

در ویدیویی دیگر، از هوش مصنوعی خواسته شده تا «انیمیشن کوتاهی از یک غول پشمالو که چشم‌های بزرگ و دهانی باز دارد و کنار شمعی قرمزرنگ زانو زده» را خلق کند. همان‌طور که می‌بینیم، Sora این بار هم ما را با خلق انیمیشن کوتاهی به سبک پیکسار غافل‌گیر کرده است.

کپشن ویدیو: انیمیشن کوتاهی شامل نمای بسته‌ی یک غول پشمالوی کوچک که پشت یک شمع قرمزِ در حال ذوب، زانو زده است. سبک ویدیو باید سه‌بعدی و واقع‌گرایانه بوده و تمرکز زیادی روی نورپردازی و بافت اشیا و اجسام معطوف باشد. از آن‌جا که هیولا با چشمان گشاد و دهان باز به شعله‌ی شمع نگاه می‌کند، حال‌وهوای ویدیو باید حالت کنجکاوانه داشته باشد. غول پشمالو معصوم و بازیگوش است و برای اولین بار در حال کشف جهان پیرامونش است. استفاده از رنگ‌های گرم و نورپردازی مناسب می‌تواند فضای ویدیو را دنج و چشم‌نواز کند.

نکته‌ی جالب در مورد این غول پشمالو، شباهت ظاهری آن به چند شخصیت کارتونی و عروسکی ازجمله فربی، گرملین و سالیوان است.

براساس ویدیوهای منتشرشده در یوتیوب، طراحی و پیاده‌سازی پشم‌ها و بافت کُرکی کاراکترهای انیمیشن کارخانه‌ی هیولاها بسیار دشوار بوده و انیماتورها باید پشم‌ها را با حرکات کاراکتر هماهنگ می‌کردند. انجام این کار برای پیکسار ماه‌ها زمان برد، اما مدل جدید هوش مصنوعی OpenAI در ویدیوی بالا خیلی سریع و راحت این کار را انجام داده است.

تیم بروکس، از اعضای تیم تحقیقاتی پروژه‌ی Sora می‌گوید: «مدل جدید ما توانایی یادگیری هندسه‌ی سه‌بعدی محیط را دارد و ما هیچ دخل و تصرفی در خلق ویدیوها نداریم. ویدیوهای تولیدشده توسط Sora حاصل تماشای حجم وسیعی از داده‌ها است.»

ویدیوی دیگری که با دستور «دنیای کاغذی از صخره‌های مرجانی پر از ماهی‌های رنگارنگ و موجودات دریایی» کمی با ویدیوهای قبلی فرق می‌کند. در این ویدیو، قاب‌ها و حرکات دوربین مدام عوض می‌شوند. پیبلس، عضو دیگر تیم تحقیقاتی پروژه‌ی Sora می‌گوید: «ما در این ویدیو شاهد شات‌ها و زوایای مختلف دوربین هستیم. این شات‌ها به طور مجزا تولید نشده‌اند بلکه مدل ما آن‌ها را در یک مرحله خلق کرده است. ما نحوه‌ی روایت داستان را به Sora نگفتیم و او به‌صورت اتوماتیک این شیوه‌ی روایت داستان را انتخاب کرده است.»

کپشن ویدیو: دنیای کاغذی از صخره‌های مرجانی پر از ماهی‌های رنگارنگ و موجودات دریایی.

در ویدیوی زیر، تصویری واقع‌گرایانه از دختری در حال قدم‌زدن در خیابان‌های بارانی توکیو را می‌بینیم. این ویدیو با دستور زیر تولید شده است:

کپشن ویدیو: زنی در حال قدم‌زدن آهسته و بااعتمادبه‌نفس در یک خیابان مرطوب و بازتاب‌دهنده‌ی نورهای رنگارنگ محیط است. در همین حال، تعدادی عابر پیاده اطراف وی قدم می‌زنند.

کپشن ویدیو: یک موجود فضایی با ظاهری طبیعی در شهر نیویورک، به سبک فیلم تریلر پارانویا، فرمت ۳۳‌میلی‌متری.

در ویدیوی آخر، نمونه‌ای از ماموت‌های منقرض‌شده در حال دویدن در زمینی برفی نزدیک کوهستان به نمایش درآمده‌اند. این ویدیو با دستور زیر تولید شده است:

کپشن ویدیو: چند ماموت عظیم‌الجثه‌ی پشمالو در یک چمن‌زار پوشیده از برف قدم می‌زنند. کرک‌های بلند آن‌ها در هوا پراکنده است و درختان با برف زیادی پوشیده شده‌اند. ویدیو در زمان عصرگاهی ضبط شده و برف قابل توجه‌ای روی دامنه و نوک کوه‌ها نشسته است. ابرهای لطیف و نور ملایم خورشید بازتاب گرم و زیبایی خلق کرده‌اند. دوربین نزدیک زمین قرار دارد و عظمت پستانداران غول‌پیکر را از زاویه‌ی پایین نمایش می‌دهد.

ویدیوهای تولیدشده توسط Sora از کیفیت بسیار بالایی برخوردارند، اما جذاب‌ترین ویژگی این مدل پیشرفته، یعنی امکان خلق ویدیو بر اساس تصاویر ثابت، هنوز در دسترس نیست و گفته می‌شود Sora به اندازه‌ی کافی آموزش ندیده که بتواند از عهده‌ی خلق این نوع ویدیوها برآید. این ویژگی هیجان‌انگیز بر پایه‌ی مدل دیفیوژن، فناوری به‌کاررفته در DALL-E و موتور مبتنی‌بر ترنسفورمرِ GPT-4 کار می‌کند.

Sora برای تولید ویدیو از روی عکس به اندازه‌ی کافی آموزش ندیده است

از این گذشته، هنوز تا ساخت یک فیلم کامل توسط هوش مصنوعی فاصله‌ی زیادی داریم. از طرف دیگر، با توجه به آن‌که پاسخ‌های مختلف Sora به یک دستور متنی یکسان، کاملاً با یک‌دیگر متفاوت هستند، نمی‌توان با چسباندن ۱۲۰ ویدیوی تولیدشده توسط Sora به یک‌دیگر یک فیلم کامل ساخت. به عبارت دیگر، در حال حاضر ایجاد پیوستگی و انسجام بین ویدیوهای مختلف این مدل پیشرفته امکان‌پذیر نیست.

فعلا با Sora نمی‌توان فیلم سینمایی ساخت

توجه داشته باشید که وقتی صحبت از رسانه‌های جمعی و شبکه‌های اجتماعی مانند اینستاگرام و تیک‌تاک به میان می‌آید، مدل هوش مصنوعی Sora و ابزارهای مشابه هیچ‌گونه محدودیتی در تولید ویدیوهای یک‌دقیقه‌ای ندارند. پیبلس می‌گوید: «برای ساخت یک فیلم حرفه‌ای نیازمند تجهیزات پیشرفته هستید و این مدل نمی‌تواند کمک بزرگی به شما ارائه دهد. Sora با ویژگی‌های منحصربه‌فردی که دارد، به افراد عادی و اینفلوئنسرها کمک می‌کند تا محتوایی باکیفیت و جذاب خلق کنند.»

در این بخش، ویدیوهای هیجان‌انگیز هوش مصنوعی Sora را دیدیم، اما در آخر، طراحان محصول و گرافیک همیشه باید نگران موقعیت شغلی خود باشند. آن‌ها همواره باید به این موضوع فکر کنند که آیا ابزارهای جدید هوش مصنوعی قرار است به آن‌ها در انجام کارهایشان کمک کنند یا آن‌که در حال تصاحب جایگاه شغلی‌شان هستند.

با توجه به آنکه مدل پیشرفته و قدرتمند Sora هنوز در فاز تحقیقات به سر می‌برد و تیم کوچکی شامل سیاست‌گذاران حوزه‌ی امنیت و حریم شخصی، محققان و هنرمندان برای ارزیابی و اطمینان از عملکرد امن آن به این مدل دسترسی دارند، تاریخ مشخصی برای عرضه‌ عمومی آن از سوی خالق ChatGPT و DALL-E اعلام نشده است.

کپی لینک

موتور مولد ویدیوی Sora چگونه کار می‌کند؟

در گزارش فنی OpenAI آمده است:

تمرکز مدل‌ها و تحقیقات قبلی بر دسته‌ی خاصی از محتوای ویدیویی، کلیپ‌های ویدیویی کوتاه یا ویدیوهایی در ابعاد و اندازه‌ی ازپیش‌تعیین‌شده معطوف است؛ حال آنکه Sora می‌تواند راجع‌به هر موضوعی ویدیو بسازد و خروجی نهایی را در مدت‌زمان، ابعاد و رزولوشن‌های مختلف ارائه دهد.

به‌طور خلاصه، مدل Sora با انجام مراحل زیر، دستورات متنی را به ویدیوهای باکیفیت ۶۰-ثانیه‌ای تبدیل می‌کند:

کپی لینک

مرحله‌ی اول: فشرده‌سازی ویدیو

Sora برای تسهیل پردازش ویدیوها، داده‌های ویدیویی را به یک فضای کوچک‌تر کاهش می‌دهد. این فضای فشرده‌شده دقیقاً همان جایی است که مدل جدید OpenAI به یادگیری و تولید ویدیو می‌پردازد.

کپی لینک

مرحله‌ی دوم: استخراج تکه‌های کوچک ویدیو موسوم به Patch

در این مرحله، تکه‌های کوچک (Patch) ویدیوها استخراج می‌شود. Sora با انجام این کار می‌تواند ویدیوها و تصاویر نهایی را در اشکال و ابعاد مختلف تولید کند.

کپی لینک

مرحله‌ی سوم: بهره‌گیری از قدرت بی‌حدومرز شبکه عصبی ترنسفورمر

اکنون Sora با استفاده از مدل‌های خاصی تحت عنوان ترنسفورمر، پچ‌های ویدیویی را پیش‌بینی کرده و کیفیت آن‌ها را افزایش می‌دهد. این مدل‌ها همچنین امکان یادگیری بیش‌تر و خلق ویدیوهای دقیق‌تر را فراهم می‌کنند.

کپی لینک

مرحله‌ی چهارم: مدت‌زمان، ابعاد و وضوح متغیر

مدل جدید OpenAI بر خلاف مدل‌های قدیمی، از داده‌های ویدیویی با ابعاد، مدت‌زمان و رزولوشن‌های گوناگون برای یادگیری استفاده می‌کند. این رویکرد باعث افزایش توانایی مدل در خلق ویدیوهای مختلف با ابعاد، مدت‌زمان و رزولوشن‌های گوناگون می‌شود.

کپی لینک

مرحله‌ی پنجم: درک زبان انسان

این مدل جهت بهبود کیفیت ویدیوهای تولیدشده، نحوه‌ی ایجاد توصیف متنی برای ویدیوها را در طول زمان یاد می‌گیرد. بنابراین اگر مدل با توصیفات دقیق و جزئی ویدیوها آشنا باشد و از الگوی آن‌ها برای ایجاد توصیفات جدید استفاده کند، درک بیش‌تر و عمیق‌تری از زبان انسان و درخواست کاربران خواهد داشت.

کپی لینک

محدودیت‌ها و نگرانی‌های جدی در مورد Sora

ویدیوهای منتشرشده در وب‌سایت OpenAI بسیار تماشایی و شگفت‌انگیز هستند و Sora می‌تواند ویدیوهای یک‌دقیقه‌ای را در ابعاد و رزولوشن‌های گوناگون تولید کند؛ اما هنوز در برخی نمونه‌ها می‌توانید ردپای هوش مصنوعی را به‌وضوح ببینید. از این گذشته، ویدیوهای تولیدشده توسط مدل جدید OpenAI از ظرافت و جزئیات بالایی برخوردار هستند، اما در بعضی سناریوهای پیچیده، رقبایی مانند Runaway عملکرد دقیق‌تری از خود نشان می‌دهند.

در بعضی سناریوها، ابزارهایی مانند Runaway عملکرد بهتری دارند

طبق بررسی‌های صورت‌گرفته توسط وب‌سایت تک‌کرانچ، در ویدیوهایی که سوژه در برابر یک شهر بزرگ ایستاده یا در منظره‌ای برفی قدم می‌زند، جزئیات زیادی در پس‌زمینه دیده نمی‌شود و حس‌وحال کلی ویدیو شباهت زیادی به بازی‌های ویدیویی دارد. در بعضی مواقع جهت حرکت وسایل نقلیه که پشت سوژه قرار دارند، معکوس می‌شود و ماشین‌ها ناگهان از جهتی به جهت دیگر می‌روند.

تیم OpenAI می‌گوید مدل انقلابی جدیدشان در کنار توانمندی‌های حیرت‌انگیز، هنوز در مواجهه با شرایط پیچیده مانند تشخیص جهت حرکت اشیاء و چیزهایی از این دست، ضعف‌هایی از خود نشان می‌دهد:

Sora بعضی اوقات نمی‌تواند فیزیک محیط‌های پیچیده و روابط میان اشیاء را با دقت بالا درک کند. برای مثال، ممکن‌است شخصی یک تکه از کوکی را بخورد اما کوکی هنوز کامل به نظر برسد و جای دندان‌های شخص روی آن ایجاد نشود. علاوه‌بر این، Sora شاید گاهی اوقات نتواند جهت‌های چپ و راست را درست تشخیص دهد و در خلق حرکت‌های دقیق دوربین و سوژه عملکرد خوبی نداشته باشد.
کپی لینک

انتشار اخبار نادرست و ویدیوهای گمراه‌کننده

چند ماه پیش خبری مبنی‌بر پاسخ اشتباه ChatGPT به سؤالات دارویی منتشر شد. حالا با نزدیک‌شدن به انتخابات ریاست جمهوری آمریکا، نگرانی‌ها بابت انتشار اخبار نادرست و ویدیوهای گمراه‌کننده توسط ابزارهای هوش مصنوعی افزایش یافته است.

پیرو این موضوع، OpenAI می‌گوید ویدیوهای تولیدشده توسط Sora قبل‌ از آنکه در اختیار کاربران قرار گیرد، چند مرحله‌ی تست و ارزیابی امنیتی و حریم خصوصی را پشت سر می‌گذارد:

ما در حال همکاری با کارشناسان فعال در حوزه‌ی اطلاعات نادرست، محتوای آزادهنده و خشونت‌آمیز و انحرافات اجتماعی هستیم. علاوه‌بر این، ما ابزارهایی برای تشخیص و برچسب‌گذاری ویدیوهای تولیدشده توسط Sora توسعه داده‌ایم.

خالق ChatGPT و DALL-E در حال حاضر محتوای تولیدشده توسط هوش مصنوعی را برچسب‌گذاری می‌کند& اما طبق اذعان این کمپانی، برچسب‌ها و واترمارک‌هایی که به محتوا افزوده می‌شوند، به‌راحتی قابل حذف هستند.

به طور کلی، ظهور چنین فناوری‌های واقع‌گرایانه‌‌ای تشخیص محتوای واقعی از محتوای دروغین را سخت می‌کند. اورن اتزیونی، استاد دانشگاه واشنگتن که در زمینه‌ی تشخیص و جلوگیری از انتشار محتوای گمراه‌کننده در کمپین‌های سیاسی فعالیت می‌کند، بعد از تماشای ویدیوهای مدل هوش مصنوعی Sora گفت: «این فناوری به‌راحتی می‌تواند در نتیجه‌ی انتخابات کشورها تأثیرگذار باشد و من دقیقاً از همین موضوع می‌ترسم.»

کپی لینک

کپی‌رایت و حریم شخصی

یک نکته‌ی شایان‌ توجه در مورد OpenAI آن است که این کمپانی جزئیات مربوط به تعداد ویدیوها و منابع استفاده‌شده برای آموزش مدل جدید هوش مصنوعی خود را فاش نکرده و صرفاً به ذکر این نکته که «در خلال آموزش Sora از ویدیوهای عمومی و تعدادی ویدیوی لایسنس‌دار استفاده شده» بسنده کرده است.

این در حالی است که نویسنده بازی تاج و تخت و نشریه‌ نیویورک تایمز با طرح شکایتی علیه مایکروسافت و اوپن‌اِی‌آی، این دو شرکت را به نقض قوانین کپی‌رایت متهم کردند. پس به احتمال زیاد، دلیل تأکید OpenAI بر استفاده از ویدیوهای لایسنس‌دار، جلوگیری از شکایت مجدد هنرمندان مبنی‌بر نقص قانون کپی‌رایت توسط این کمپانی است.

طبق بیانیه‌ی OpenAI، این شرکت برای بهبود دقت و کیفیت ویدیوهای تولیدشده توسط Sora، این مدل را داده‌هایی معادل ۱۰ هزار ساعت محتوای ویدیویی باکیفیت آموزش داده است. اگرچه OpenAI اطلاعات مختصری راجع‌به حجم محتوای ویدیویی استفاده‌شده برای آموزش مدل جدیدشان ارائه کرده‌، برخی گمانه‌زنی‌ها حاکی‌ از به‌کارگیری داده‌های مربوط به موتور پردازش تصویر Unreal Engine 5 برای آموزش Sora است.

از این‌ها گذشته، اندرو نیوول، مدیر ارشد تحقیقات سازمان iProov در مصاحبه با CBSNews از خطرات جدی Sora برای هنرمندان و اشخاص عادی جامعه می‌گوید:

افراد با استفاده از هوش مصنوعی مولد ویدیو Sora می‌توانند چهره‌ی هنرمندان و سایر افراد جامعه را بازسازی کرده و از آن برای اخاذی یا کلاه‌برداری استفاده کنند. لازمه‌ی مقابله‌ی درست با خطرات و نگرانی‌های هوش مصنوعی، توسعه‌ی ابزارهایی در راستای تشخیص و اطلاع‌رسانی راجع‌به محتوای غیر واقعی است.

در همین راستا، ریس هیدن، تحلیلگر ارشد شرکت ABI Research، بر این باور است که «توسعه و انتشار ابزارهای مبتنی‌بر هوش مصنوعی چندوجهی مانند Sora مشاغل صداپیشگان و هنرمندانی که با ساخت ویدیوهای کوتاه و انتشار آن در شبکه‌های اجتماعی درآمدزایی می‌کنند را به خطر می‌اندازد. با بهبود کیفیت این مدل‌ها، در آینده‌ای نه‌چندان دور، دیگر کسی برای ساخت تیزرهای تبلیغاتی سراغ بازیگران واقعی نمی‌رود و به احتمال زیاد، استفاده از کاراکترهای خلق‌شده توسط هوش مصنوعی به امری عادی تبدیل خواهد شد.»

کپی لینک

نبود شفافیت

یکی از چالش‌ها و نگرانی‌های همیشگی مدل‌های مبتنی‌بر هوش مصنوعی مولد، داده‌هایی است که برای آموزش آن‌ها به کار رفته است. اد نیوتن رکس، مدیرعامل مؤسسه‌ی هوش مصنوعی Fairly Trained در این رابطه می‌گوید:

شما هرگز نمی‌توانید ثابت کنید که این مدل‌ها در حال رقابت با داده‌های آموزشی و هنرمندان خالق آن آثار نیستند. آیا مشخص است که این مدل‌ها با استفاده از چه داده‌هایی آموزش دیده‌اند؟ آیا هنرمندانی که آثار آن‌ها برای آموزش مدل هوش مصنوعی استفاده شده، راضی به استفاده از اثرشان در نتیجه‌ی نهایی مدل هستند؟ به‌هرحال ممانعت OpenAI از انتشار جزئیات و اطلاعات کامل در این زمینه، دامنه‌ی نگرانی‌ها را گسترده‌تر می‌کند.
کپی لینک

قابل‌ پیش‌بینی‌ نبودن نحوه‌ی استفاده از Sora

یکی از ویژگی‌های Sora که احتمال انتشار آن در آینده‌ی نزدیک بسیار پایین است، امکان تولید ویدیو با استفاده از تصاویر ثابت یا دنباله‌ای از تصاویر است. بروکس می‌گوید: «این ویژگی هیجان‌انگیز Sora نحوه‌ی داستان‌سرایی را تا حد زیادی دگرگون می‌کند. شما می‌توانید تصویری که در ذهن‌تان دارید را در اختیار هوش مصنوعی قرار دهید و از آن بخواهید تصاویر مورد نظر شما را متحرک کند. OpenAI نسبت به پتانسیل‌های تولید دیپ‌فیک و خلق محتوای ناسالم به کمک Sora آگاهی کامل دارد و ما باید وسواس و دقت زیادی روی امنیت این مدل داشته باشیم.»

کپی لینک

جمع‌بندی: سورا، شگفت‌انگیز یا خطرناک؟

با وجود نگرانی‌ها و چالش‌ها، ابزارهایی مانند DALL-E، میدجرنی و سایر مدل‌های هوش مصنوعی مولد در طول یکی دو سال گذشته بسیار پیشرفته‌تر شده‌اند و این روزها تشخیص تصویر تولیدشده توسط هوش مصنوعی از عکس واقعی بسیار دشوار است. یکی از پیامدهای منفی این موضوع، گسترش اخبار نادرست و محتوای گمراه‌کننده در اینترنت است.

علاوه‌براین، با ظهور ابزارهای مبتنی‌بر هوش مصنوعی، طیف وسیعی از هنرمندان و متخصصان شغل خود را از دست دادند. به قولِ رید سوتن، هنرمند آمریکایی، «پارسال همه‌ی ما به میدجرنی می‌خندیدیم و حالا هنرمندان در حال واگذاری شغل خود به میدجرنی هستند.»

از سوی دیگر، فیلم‌سازان و توسعه‌دهندگان جامعه‌ی هوش مصنوعی، Sora را جهش بزرگی رو به جلو و گامی مهم برای هوش مصنوعی مولد می‌دانند که قادر به انجام کارهایی است که زمانی به عنوان احتمالات بعید تلقی می شد. اوپن‌ای‌آی می‌گوید Sora را در اختیار برخی هنرمندان تجسمی، طراحان و فیلمسازان قرار داده تا تمام راه‌هایی را که ممکن است از این ابزار سوءاستفاده شود، بررسی کنند.

البته سورا هنوز کاستی‌های آشکاری دارد. مثلاً اینکه هیچ دیالوگی در این ویدیوها وجود ندارد، چون هوش مصنوعی هنوز نمی‌تواند حرکت دهان فرد را به‌درستی پیاده‌سازی کند. بااینکه سورا می‌تواند کلیپ‌های یک‌دقیقه‌ای شگفت‌انگیزی بسازد، به این معنی نیست که می‌تواند از پس تولید یک فیلم بلند و منسجم برآید.

پال تریلو، فیلم‌ساز آمریکایی می‌گوید: «دیدگاه بسیار خوشبینانه‌ی من درباره‌ی Sora این است که افراد فعال در حوزه‌ی فیلم‌سازی همان حقوق فعلی خود را دریافت خواهند کرد، اما دیگر لازم نیست زندگی را فدای کارشان کنند.»

مقاله رو دوست داشتی؟
نظرت چیه؟
داغ‌ترین مطالب روز
چند حیوان از دنیای ماینکرفت درحال دویدن
آپدیت بزرگ ماینکرفت، گرافیک بازی را پس از سال‌ها سرزنده‌تر می‌کند

استودیوی موجانگ با آپدیت Vibrant Visuals، پس از سال‌ها ظاهر بازی ماینکرفت را مدرن‌تر می‌کند.

101
2 روز پیش
منوی باتری گوشی شیائومی 13T
چطور سلامت باتری گوشی اندروید یا آیفون را بررسی کنیم؟

باتری یکی از مهم‌ترین بخش‌های گوشی هوشمند است که سلامت آن اهمیت زیادی دارد. در این مقاله با روش‌های بررسی سلامت باتری گوشی‌های هوشمند آشنا می‌شویم.

57
2 روز پیش
پلی استیشن ۱ سفارشی Playstacean
این خرچنگ دوست‌داشتنی، نسخه سفارشی کنسول پلی استیشن ۱ است

وقتی به‌اندازه‌ی کافی خلاق باشید، حتی می‌توانید کنسول کلاسیک پلی استیشن ۱ را به شکل غیرمعمولی مثل خرچنگ تغییر دهید.

36
یک روز پیش
 تشخیص محتوای تولیدشده با هوش مصنوعی
چگونه محتوای تولیدشده با هوش مصنوعی را تشخیص دهیم؟

با افزایش محتوای نوشته‌شده با هوش مصنوعی، تشخیص این محتوا از آنچه که انسان نوشته، ضروری است. با روش تشخیص محتوای تولیدشده با هوش مصنوعی آشنا شوید.

10
2 روز پیش
استیو بالمر / Steve Ballmer
بیوگرافی استیو بالمر؛ مرد اشتباهات بزرگ و موفقیت‌های بزرگ‌تر

در دنیایی که مدیران پشت پرده تصمیم‌گیری می‌کنند، استیو بالمر روی صحنه‌ عشقش به مایکروسافت را فریاد زد. این روایت زندگی پر شور و تصمیمات جنجالی اوست.

55
17 ساعت پیش
نمایشگر گلکسی S25 و گلکسی S25 پلاس
تنظیمات پیامک گوشی سامسونگ که هر کاربری به آن نیاز دارد

در این مقاله، با برخی از تنظیمات پیامک گوشی سامسونگ آشنا می‌شویم و روش‌هایی را برای رفع مشکل ارسال اس‌ام‌اس طولانی در برنامه Message معرفی می‌کنیم.

47
18 ساعت پیش
ساعت هوشمند یونیکورن مکس
ساعت هوشمند جدید ایتل قیمت ارزان، نمایشگر پرنور اولد و تماس بلوتوثی دارد

کاربران می‌توانند با قیمت بسیار ارزان از قابلیت‌های متعدد ساعت هوشمند یونیکورن مکس ایتل مانند ویژگی‌های پایش سلامت بهره ببرند.

34
2 روز پیش
تبلیغات
DN-DNShatel

نظرات

تبلیغات
D7-B6Snappshop
D7-zoomitproduct
آخرین ویدیوها
پخش از رسانه
بررسی هدفون سونی WF-1000XM5
بررسی هدفون توگوشی XM5 سونی
00:10:23
عکس گوشی ردمی نوت ۱۴ پرو و ردمی نوت ۱۴ پرو پلاس
بررسی ردمی نوت ۱۴ پرو و ۱۴ پرو پلاس 5G
00:13:31
زومکست با مدیرعامل جاباما
گفتگو با مدیرعامل جاباما؛ فرصتی برای دیدن ناشناخته‌های ایران
00:38:48
دیگه گلس نخر در حال شکستن یک گلس
شیشه‌های ضد خش گوشی چطوری ساخته می‌شن؟
00:13:15
نگاه نزدیک به ردمی نوت ۱۴ پرو پلاس و ردمی نوت ۱۴ پرو شیائومی
نگاه نزدیک به ردمی نوت ۱۴ پرو پلاس و ردمی نوت ۱۴ پرو شیائومی
00:14:33
عکس بهزاد مرعشیان و امیر خاوران در کنار هم
سرویس تحقیقات بازار دیجی‌کالا چیه؟
00:30:05
موشک استارشیپ روی سکوی پرتاب در تاسیسات استاربیس
پخش زنده پرتاب آزمایشی هشتم موشک استارشیپ
02:00:00
عکس مهرداد با قطعات داخلی آل این وان gt624 گرین
بررسی آل این وان گرین مدل GT624
00:35:45
عکس گوشی پوکو X7 پرو در دست
بررسی گوشی پوکو X7 پرو
00:10:50
عکس مسعود یوسف‌نژاد در کنار بهزاد اکبری
عقب‌گرد اکوسیستم استارتاپی بر اثر فیلترینگ
00:36:29
عکس گوشی‌های پوکو ایکس ۶ پرو و داریا باند ۲ در کنار هم
مقایسه گوشی داریا باند ۲ با پوکو X6 Pro
00:11:29
عکس گلکسی اس ۲۵ اولترا و آیفون ۱۶ پرومکس در کنار هم و مقایسه دوربین
مقایسه دوربین گلکسی S25 اولترا و آیفون 16 پرو مکس
00:47:42
عکس ری‌برندینگ همراه اول و ساین جدید این اپراتور
مراسم ری‌برندینگ همراه اول؛ هویت جدید چه فرقی کرده؟
00:07:27
زومیت چطور بررسی می‌کنه؟
محصولات چطور تو زومیت بررسی می‌شن؟ 🔍📦
00:10:48
پشت پرده بزرگ‌ترین هک تاریخ کریپتو
پشت پرده بزرگ‌ترین هک تاریخ کریپتو
00:06:49
عکس مسعود یوسف نژاد و پشوتن پورپزشک درکنارهم و موضوع فیلترینگ اینستاگرام
شکست ۳ ساله فیلترینگ اینستاگرام؛ رشد ۳ برابری فروش ایرانی‌ها
00:32:59
آیفون ۱۶ ای و بی معنا
جایگزین آیفون اس ای معرفی شد؛ قلبی جدید با قیمت بالا 🔻
00:09:24
تصویر شادان با مکبوک و لوگو نرم افزارهایی که روی مک نصب می شوند و نمیشوند
قبل از خرید مک‌بوک این ویدیو رو ببین!
00:13:44
عکس بهزاد با میکروفون زومیت در دست و ماشین لباس‌شویی پاکشوما
برند پاکشوما در تولد ۵۰ سالگی خودش، ری‌برند شد
00:12:44
نسل دوم انحصار؟ 📦 آنباکس داریا باند ۲
نسل دوم انحصار؟ 📦 آنباکس داریا باند ۲
00:17:09
عکس آقای مصحفی با دو تا ماه در دست و زمین در پشت سر او
چی می‌شد اگه زمین ۲ تا ماه داشت؟
00:06:23
آموزش نصب لینوکس روی اندروید
آموزش نصب لینوکس روی گوشی‌های اندروید
00:30:39
عکس گوشی گلکسی اس ۲۵ و اس ۲۵ پلاس در کنار هم
بررسی گلکسی اس ۲۵ و اس ۲۵ پلاس
00:13:47
هوش مصنوعی سامسونگ
بررسی قابلیت‌های هوش مصنوعی سامسونگ در اس ۲۵
00:20:23
آینده تکنولوژی با ترامپ چطور خواهد شد؟
ترامپ با آینده تکنولوژی چی کار می‌کنه؟
01:14:29
عکس کاور خبرنگار زومیت و مدیرعامل زرپاد
قبل از خرید طلای آنلاین این ویدیو رو تماشا کنید!
00:01:12
همه چیز درباره دیپ سیک
دیپ سیک؛ انقلاب هوش مصنوعی از چین 🇨🇳⚡💻
00:23:37
بررسی گلکسی اس ۲۵ اولترا سامسونگ
بررسی گلکسی اس ۲۵ اولترا سامسونگ؛ چاقوی کند سامسونگ 🔪🔥
00:19:41
گوشی اشتراکی
گوشی اشتراکی؟! دیگه گوشیت مال خودت نیست! 😳📱
00:09:55
عکس پلتفرم ابرآمد در رویداد ابری‌گپ
گزارش زومیت از رویداد «ابری‌گپ»
00:08:39
عکس امیرمحمد سلیمانی و میکروفون زومیت در دستانش
پشت صحنه اولین دورهمی حضوری زومیت
00:16:35
چیزایی که سامسونگ توی رویداد آنپکد بهتون نگفت!
چیزایی که سامسونگ توی رویداد آنپکد بهتون نگفت!
00:07:56
اولین گردهمایی زومیت و پوشش زنده‌ی رویداد آنپکد سامسونگ
نسخه آفلاین پوشش زنده دورهمی زومیت
03:04:03
عکس سری گلکسی اس ۲۵ سامسونگ در دست بهزاد
نگاه نزدیک زومیت به خانواده گلکسی اس ۲۵
00:08:52
۴ مرد جوان در کاور مراسم رونمایی گلکسی اس ۲۵
پوشش زنده دورهمی زومیت؛ مراسم معرفی سری گلکسی اس ۲۵ سامسونگ
03:00:00
انتظارات از رویداد معرفی گلکسی اس ۲۵ سامسونگ و دورهمی زومیت
انتظارات از رویداد معرفی سری اس ۲۵ سامسونگ و دورهمی زومیت
00:11:31
عکس بهزاد در ماشین پرنده و لوگو CES
۱۰ فناوری برتر امسال که آینده رو تغییر می‌دن
00:11:52
کاور دورهمی زومیت
اولین دورهمی حضوری زومیت؛ گردهمایی بزرگ عاشقان فناوری 🎉
00:01:04
انتظارات زومیت از دوربین گلکسی اس ۲۵ اولترا سامسونگ
گلکسی اس ۲۵ اولترا تو راهه؛ از دوربین این گوشی چی می‌دونیم؟
00:09:51
عکس بهزاد و هادی با جعبه‌های دیجی‌کالا و لوگوی بیسوس
آنباکس ۴۰ میلیونی کالاهای متنوع بیسوس
01:13:38
کامپیوترهای کوانتومی و جهان های موازی
همه چیز درباره کامپیوترهای کوانتومی
00:13:43
عکس کاور دیجی پی
گزارش غرفه‌ی دیجی‌پی در نمایشگاه بین‌المللی ریتیل شو تهران
00:08:40
گلکسی اس ۲۴ اولترا نه، اس ۲۵ اولترا خوبه
اس۲۴ اولترا نخر؛ اس۲۵ اولترا داره میاد!!! 🤯
00:08:54
کیس خوب چه ویژگی‌هایی داره؟
قبل از خرید کیس کامپیوتر به این نکات توجه کنید ⚠️
00:07:56
بررسی کاور فر تو کار ال جی
معرفی فر تو کار ال‌جی؛ مدل ۷۶ لیتری LG InstaView
00:04:55
کاور ویدئو بررسی لپ تاپ Stealth GS77 ام اس آی / MSI Stealth GS77 Review
بررسی لپ تاپ Stealth GS77 ام اس آی / MSI Stealth GS77 Review
00:09:22
کاور ویدئو بررسی لپ تاپ ROG Zephyrus G14 ایسوس / ASUS ROG Zephyrus G14 Review
بررسی لپ تاپ ROG Zephyrus G14 ایسوس / Zephyrus G14 Review
00:10:58
کاور ویدئو برررسی شیائومی 12T و 12T پرو / Xiaomi 12T & 12T Pro Review
برررسی شیائومی 12T و 12T پرو / Xiaomi 12T & 12T Pro Review
00:09:07
کاور ویدئو بررسی سرفیس پرو 9 مایکروسافت / Surface Pro 9 Review
بررسی سرفیس پرو 9 مایکروسافت / Surface Pro 9 Review
00:11:32
کاور ویدئو بررسی کیس اسمبل شده MEG Aegis Ti5 ام اس آی / MSI MEG Aegis Ti5 Review
بررسی کیس اسمبل شده MEG Aegis Ti5 ام اس آی / MEG Aegis Ti5
00:09:54
coming soon...

مقایسه قیمت و مشخصات 🛒

پنل جلو و پشت گوشی موبایل گلکسی A36 سامسونگ ارغوانی / Samsung Galaxy A36پنل جلو و پشت گوشی موبایل گلکسی A36 سامسونگ ارغوانی / Samsung Galaxy A36
4.2
گلکسی A36 سامسونگ

از30,899,000تومان

پنل جلو و پشت گوشی موبایل گلکسی A56 سامسونگ زیتونی / Samsung Galaxy A56پنل جلو و پشت گوشی موبایل گلکسی A56 سامسونگ زیتونی / Samsung Galaxy A56
4
گلکسی A56 سامسونگ

از35,500,000تومان

پنل جلو و پشت گوشی موبایل پوکو X7 شیائومی مشکی و زرد / Xiaomi Poco X7پنل جلو و پشت گوشی موبایل پوکو X7 شیائومی مشکی و زرد / Xiaomi Poco X7
3.7
پوکو X7 شیائومی

از26,199,000تومان

پنل جلو و پشت گوشی موبایل پوکو X7 پرو شیائومی مشکی و زرد / Xiaomi Poco X7 Proپنل جلو و پشت گوشی موبایل پوکو X7 پرو شیائومی مشکی و زرد / Xiaomi Poco X7 Pro
4.7
پوکو X7 پرو شیائومی

از30,999,000تومان

پنل جلو و پشت گوشی موبایل گلکسی اس 25 سامسونگ سرمه ای / Samsung Galaxy S25پنل جلو و پشت گوشی موبایل گلکسی اس 25 سامسونگ سرمه ای / Samsung Galaxy S25
4.4
گلکسی اس 25 سامسونگ

از76,499,000تومان

پنل جلو و پشت گوشی موبایل آیفون 16 اپل آبی / Apple iPhone 16پنل جلو و پشت گوشی موبایل آیفون 16 اپل آبی / Apple iPhone 16
3.6
آیفون 16 اپل

از77,000,000تومان

پنل جلو و پشت گوشی موبایل آیفون 16 پرو مکس اپل مشکی / Apple iPhone 16 Pro Maxپنل جلو و پشت گوشی موبایل آیفون 16 پرو مکس اپل مشکی / Apple iPhone 16 Pro Max
3.8
آیفون 16 پرو مکس اپل

از123,800,000تومان

پنل جلو و پشت گوشی موبایل آیفون 16 پرو اپل بژ / Apple iPhone 16 Proپنل جلو و پشت گوشی موبایل آیفون 16 پرو اپل بژ / Apple iPhone 16 Pro
4.4
آیفون 16 پرو اپل

از105,500,000تومان

کنسول بازی پلی استیشن 5 پرو سونی / Sony PlayStation 5 Proکنسول بازی پلی استیشن 5 پرو سونی / Sony PlayStation 5 Pro
4
اپل ایرپادز 4 به همراه کیساپل ایرپادز 4 به همراه کیس
3
اپل ایرپاد 4

از12,300,000تومان

پنل جلو و پشت گوشی موبایل گلکسی A55 سامسونگ آبی روشن / Samsung Galaxy A55پنل جلو و پشت گوشی موبایل گلکسی A55 سامسونگ آبی روشن / Samsung Galaxy A55
4.2
گلکسی A55 سامسونگ

از25,400,000تومان

پنل جلو و پشت گوشی موبایل گلکسی A15 سامسونگ سرمه ای تیره / Samsung Galaxy A15پنل جلو و پشت گوشی موبایل گلکسی A15 سامسونگ سرمه ای تیره / Samsung Galaxy A15
4.4
گلکسی A15 سامسونگ

از11,650,000تومان

پنل جلو و پشت گوشی موبایل پوکو X6 پرو شیائومی مشکی / Xiaomi Poco X6 Proپنل جلو و پشت گوشی موبایل پوکو X6 پرو شیائومی مشکی / Xiaomi Poco X6 Pro
4.3
پوکو X6 پرو شیائومی

از27,390,000تومان

پنل جلو و پشت گوشی موبایل پوکو X6 شیائومی سفید / Xiaomi Poco X6پنل جلو و پشت گوشی موبایل پوکو X6 شیائومی سفید / Xiaomi Poco X6
4
پوکو X6 شیائومی

از25,877,000تومان

پنل جلو و پشت گوشی موبایل پوکو F6 پرو شیائومی مشکی / Xiaomi Poco F6 Proپنل جلو و پشت گوشی موبایل پوکو F6 پرو شیائومی مشکی / Xiaomi Poco F6 Pro
4.5
پوکو F6 پرو شیائومی

از41,899,000تومان

گوشی موبایل گلکسی زد فولد 6 سامسونگ صورتی / Samsung Galaxy Z Fold6گوشی موبایل گلکسی زد فولد 6 سامسونگ صورتی / Samsung Galaxy Z Fold6
4.1
پنل جلو و پشت گوشی موبایل گلکسی A35 سامسونگ بنفش روشن / Samsung Galaxy A35پنل جلو و پشت گوشی موبایل گلکسی A35 سامسونگ بنفش روشن / Samsung Galaxy A35
4.3
گلکسی A35 سامسونگ

از21,200,000تومان

پنل جلو و پشت تبلت آیپد پرو 13 اپل نسخه 2024 مشکی / Apple iPad Pro 13 2024پنل جلو و پشت تبلت آیپد پرو 13 اپل نسخه 2024 مشکی / Apple iPad Pro 13 2024
3.8
موبایل آیفون 13 اپل / Apple iPhone 13موبایل آیفون 13 اپل / Apple iPhone 13
4.1
آیفون 13 اپل

از52,000,000تومان

گوشی موبایل ردمی نوت 13 پرو شیائومی / Xiaomi Redmi Note 13 Pro سفیدگوشی موبایل ردمی نوت 13 پرو شیائومی / Xiaomi Redmi Note 13 Pro سفید
4.5
پنل جلو و پشت گوشی موبایل گلکسی اس 24 سامسونگ زرد / Samsung Galaxy S24پنل جلو و پشت گوشی موبایل گلکسی اس 24 سامسونگ زرد / Samsung Galaxy S24
4.4
گلکسی اس 24 سامسونگ

از75,979,000تومان

موبایل آیفون 13 پرو مکس اپل آبی / APPLE IPHONE 13 PRO MAX Sierra blueموبایل آیفون 13 پرو مکس اپل آبی / APPLE IPHONE 13 PRO MAX Sierra blue
3.5
آیفون 13 پرو مکس اپل

از80,630,000تومان

گوشی موبایل آیفون 13 پرو اپل / Apple iPhone 13 Pro آبیگوشی موبایل آیفون 13 پرو اپل / Apple iPhone 13 Pro آبی
4
آیفون 13 پرو اپل

از73,000,000تومان

موبایل ردمی 9A شیائومی / Xiaomi Redmi 9Aموبایل ردمی 9A شیائومی / Xiaomi Redmi 9A
3.6
ردمی 9A شیائومی

از6,500,000تومان

گوشی موبایل آیفون 15 پرو اپل / Apple iPhone 15 Pro تیتانیومگوشی موبایل آیفون 15 پرو اپل / Apple iPhone 15 Pro تیتانیوم
4.1
آیفون 15 پرو مکس اپل

از109,200,000تومان

با چشم باز خرید کنید
زومیت شما را برای انتخاب بهتر و خرید ارزان‌تر راهنمایی می‌کند
ورود به بخش محصولات