موفقیت هوش مصنوعی سامسونگ در خلق تصاویر متحرک تنها با یک عکس

جمعه ۳ خرداد ۱۳۹۸ - ۱۴:۳۳

مطالعه 3 دقیقه

در مدلی جدید با استفاده از یادگیری ماشین، لابراتور هوش مصنوعی سامسونگ تنها با در اختیار داشتن یک عکس یا نقاشی از شخص می‌تواند تصویر متحرکی بسیار زنده خلق کند.

تبلیغات

محققان حوزه یادگیری ماشین موفق به طراحی سیستمی شدند که می‌تواند تصویر متحرک شبیه‎سازی‌شده‌ی بسیار واقعی را تنها با یک فریم از چهره شخص و حتی یک نقاشی‌ بازسازی کند. این سیستم هنوز کامل نشده و در حال آزمایش است، اما زمانی‌که به سیستمی تمام عیار تبدیل شود، مانند دستاوردهای هوش مصنوعی، بسیار جذاب و شگفت‌انگیز خواهد بود.

این مدل در مقاله‌ای منتشر شده توسط مرکز تحقیقات هوش مصنوعی سامسونگ (Samsung AI Center) به‌ثبت رسیده است. امکان دسترسی به این مقاله در آرشیو Arxiv وجود دارد. این مدل جدید از روشی برای بازسازی چهره با دو الگوی چهره منبع و چهره هدف استفاده می‌کند. تمام نشانه‌های صورت، هر کدام از اجزای صورت که به هنگام صحبت کردن به‎کار گرفته می‌شود در چهره منبع (source face) ذخیره می‌شود. سپس این اطلاعات به‌دست آمده از صورت در چهره هدف (target face) اعمال می‌شود. این کار باعث می‌شود تا شبیه‌سازی صورت هدف از روی صورت منبع صورت گیرد یعنی چهره هدف همان کاری را انجام دهد که چهره منبع انجام می‌دهد.

این مدل به‌نوبه خود جدید نیست، بلکه بخشی از موضوع تصویرسازی مصنوعی است که دنیای هوش مصنوعی در حال حاضر با آن روبه‌رو است. موضوع بسیار جذابی که اخیرا در رویداد رباتیک و هوش مصنوعی دانشگاه برکلی مورد بحث قرار گرفت. امکان شبیه‌سازی چهره به‌صورت ویدئویی ازطریق الگو قرار دادن چهره‌ای دیگر وجود دارد. به‌طوری که چهره ویدئویی می‌تواند حالت حرف زدن یا نگاه کردن شخصی را شبیه‌سازی کند. اما بسیاری از این مدل‌ها، نیازمند اطلاعات درخورتوجهی مانند، یک تا دو دقیقه از تجزیه و تحلیل دقیق ویدئویی هستند.

مقاله‌های مرتبط:

آیا می‌توان به فناوری تشخیص چهره تفاوت نژادها را آموخت؟

سنسور تشخیص چهره، حریم خصوصی کاربران گوشی‌ هوشمند را تضعیف می‌کند

در مقاله جدیدی که از سوی پژوهشگران Samsung در مرکز مسکو منتشر شده است؛ آن‌ها موفق به ساخت ویدئویی، تنها با استفاده از یک تصویر فرد شدند که می‌توانست صورتش را بچرخاند، صحبت کند و عبارات عادی را بیان کند. اگرچه این ویدئو متقاعدکننده به‌نظر می‌رسید اما به دور از نقص نبود.

ساخت این ویدئو با استفاده از فرایند شناسایی نشانه‌های صورت با به‌کارگیری داده‌های بسیار زیاد انجام شد. این مدل به‌دنبال بخشی از اجزای چهره هدف بود که با چهره منبع مطابقت پیدا می‌کرد. در این مدل هرچه داده‌ها بیشتر باشد، نتیجه بهتر و کامل‌تری حاصل می‌شود. این درحالی است که این داده‌ها فقط باید از یک تصویر به دست آمده باشند که به آن یادگیری تک‌شات (single-shot learning) گفته می‌شود.

با استفاده از این مدل می‌توان با داشتن تنها یک تصویر از انیشتین، مریلین مونرو یا حتی مونا لیزا تصاویر متحرکی از آن‌ها ساخت که گویا صحبت می‌کنند و صورتشان را مانند یک انسان واقعی حرکت می‌دهند.

برای نمونه، در تصویری که مشاهده می‌کنید مونا لیزا با سه چهره منبع مختلف به‌صورت انیمیشن شبیه‌سازی شده است که نتایج مختلفی در ساختار صورت و رفتار آن قابل مشاهده است.

همچنین، این مدل از فناوری Generative Adversarial Network استفاده می‌کند. این فناوری با قرار دادن دو مدل دربرابر یکدیگر، تلاش بر فریب دیگری دارد تا بتواند بیننده را متقاعد کند که آنچه ایجاد شده واقعی است. این بدان معنا است که نتایج حاصل شده با سطح مشخصی از واقع‌گرایی از سوی سازندگان این مدل تعیین شده است. به‌طوری که در مدل discriminator با قطعیت ۹۰ درصد گفته می‌شود که خروجی، تصویر یک انسان واقعی است.

در نمونه‌های دیگری که از سوی پژوهشگران ارائه شد، کیفیت و وضوح چهره‌ی شبیه‌سازی شده‌ی درحال صحبت کاملا متفاوت بود. برخی تلاش کردند تا تصویر شخصی را از یک برنامه خبری تکثیر کنند و در آن حتی زیرنویس اخبار شبکه را در زیر تصویر با کمک اطلاعات ساختگی بازسازی کردند و جزئیات تصویری دیگر را نیز در آن گنجاندند.

همان‌طور که گفته شد، این مدل جدید هنوز کامل نیست. این مدل تنها می‌تواند صورت و گردن به بالا را به‌صورت ویدئویی شبیه‌سازی کند. پس فعلا انتظار رقصیدن مونا لیزا یا دست زدن او را نداشته باشید.

مقاله رو دوست داشتی؟

نظرت چیه؟

فاطمه سعادت پور

داغ‌ترین مطالب روز

گزارش ماه فوریه اسپیدتست؛ افت چند رتبه‌ای ایران در جدول میانه سرعت اینترنت ثابت و موبایل

در گزارش فوریه ۲۰۲۵ اسپیدتست، ایران در جدول میانه سرعت اینترنت ثابت ۴ پله و در جدول میانه سرعت اینترنت همراه ۳ پله سقوط کرده است.

340

21 ساعت پیش

ظاهراً مهندسان دیپ‌سیک پاسپورتشان را به دولت چین تحویل داده‌اند

ظاهرا برخی از مهندسان دیپ‌سیک پاسپورتشان را به دولت چین تحویل داده‌اند تا مبادا با سفر به کشورهای دیگر، اسرار تجاری مهم را فاش کنند.

یک روز پیش

مستربیست، بزرگ‌ترین یوتیوبر جهان: دلتان نمی‌خواهد جای من باشید

مستربیست، بزرگ‌ترین و پرمخاطب‌ترین یوتیوبر دنیا، در پادکستی جدید از سختی‌ها و فشار زندگی گلایه می‌کند.

18 ساعت پیش

چطور در اینستاگرام پیام‌های محوشونده بفرستیم؟

اینستاگرام با حالت Vanish Mode سطح جدیدی از حریم خصوصی را اضافه کرده است تا کاربران بتوانند پیام‌های محوشونده ارسال کنند.

12 ساعت پیش

بهترین ماشین‌های لباسشویی خارجی در بازار ایران

بهترین ماشین لباسشویی خارجی در بازار ایران [اسفند ۱۴۰۳]

در مقاله‌ی پیش‌ رو بهترین ماشین‌های لباسشویی موجود در بازار از برندهای ال‌جی، سامسونگ و بوش را با ظرفیت‌های مختلف معرفی کرده‌ایم.

2 روز پیش

بهترین ابزارهای رایگان ساخت عکس با هوش مصنوعی در سال ۲۰۲۵

هوش مصنوعی دنیای تصویرسازی را متحول کرده است. در این مقاله، بهترین ابزارهای رایگان ساخت عکس با هوش مصنوعی را به شما معرفی می‌کنیم.

14 ساعت پیش

بیت کوین / Bitcoin در آتش نشان دهنده افزایش قیمت بیتکوین

پیش‌بینی غیرمنتظره یکی از تحلیلگران از قیمت بیت‌کوین

بازار کریپتو در مسیر پرنوسانی قرار دارد؛ اما تحلیلگری نام‌آشنا ادعای جسورانه‌ای درباره آینده بیت‌کوین مطرح کرده است که می‌تواند همه را غافلگیر کند.

یک روز پیش

نظرات