D1-lg

هوش مصنوعی گوگل اجسام را به‌نحو واقع‌ گرایانه وارد تصاویر می‌کند

شنبه ۲۴ آذر ۱۳۹۷ - ۱۷:۱۵
مطالعه 3 دقیقه
اخیرا پژوهشگران سیستم هوش مصنوعی (Artificial Intelligence) تازه‌ای توسعه داده‌اند که می‌تواند اجسام را به‌نحو واقع‌گرایانه و باورپذیر به تصاویر اضافه کند.
تبلیغات
D4-mci

استفاده از نرم‌افزار پس‌تولید برای قراردادن واقع‌گرایانه‌ی اشیاء در صحنه‌ها، برای کامپیوترها به‌مراتب دشوارتر از انسان‌ها است. انجام این کار نه‌تنها نیازمند تعیین مکانی مناسب برای شیء مدنظر است؛ بلکه به تلاش برای پیش‌بینی ظاهر شی‌ء در محل هدف شامل مقیاس، انسدادها، حالت، شکل و... نیز احتیاج دارد.

خوشبختانه هوش مصنوعی وعده‌ی کمک در انجام این کار را می‌دهد. در مقاله‌ای به‌نام ترکیب و جای گذاری آگاه به متن نمونه‌های شیء که هفته‌ی گذشته در کنفرانس NeurIPS 2018 پذیرفته شد، پژوهشگران در دانشگاه ملی سئول و دانشگاه کالیفرنیا در مرسد و هوش مصنوعی گوگل سیستمی را توصیف می‌کنند که قراردادن شی‌ء را درون یک تصویر به‌نحو «معنادار و هماهنگ» یا به‌عبارت‌دیگر، قانع‌کننده آموزش می‌بیند.

پروهشگران در مقاله‌ی خود می‌نویسند:

قراردادن اشیاء درون تصویر که به‌نحو معناداری با صحنه مطابق باشند، کار هیجان‌انگیز و جالب‌توجه‌ای است. این کار با بسیاری از کاربرد‌های دنیای واقعی، ازجمله ترکیب تصویر و ویرایش محتوای واقعیت افزوده و مجازی و تصادفی‌سازی دامنه به‌شدت مرتبط است. چنین مدل قرارگیری اشیایی به‌صورت بالقوه می‌تواند کاربردهای بی‌شماری از ویرایش تصویر و تجزیه‌وتحلیل صحنه را تسهیل کند.

چهارچوب دوطرفه‌ی پژوهشگران دربردارنده‌ی دو ماژول است: یکی محل قرارگیری شیء و دیگری ظاهری را تعیین می‌کند که آن شیء باید داشته باشد. این دو ماژول از شبکه‌های خصمانه‌ی مولد (GANs) یا شبکه‌های دوبخشی عصبی بهره می‌گیرند که شامل مولدهای ایجادکننده‌ی نمونه‌ها و تفکیک‌دهنده‌هایی هستند که برای تمایز بین نمونه‌های ایجادشده و نمونه‌های دنیای واقعی تلاش می‌کنند. ازآنجاکه سیستم به‌طور هم‌زمان توزیع را با‌توجه‌به تصویر قرارداده‌شده مدل‌سازی می‌کند، به هر دو ماژول امکان می‌دهد با یکدیگر ارتباط برقرار و همدیگر را بهینه‌سازی کنند.

Google’s AI

مؤلفان مقاله‌ی مذکور می‌نویسند:

مهم‌ترین ویژگی تازه و فنی این کار، ساخت شبکه‌ی عصبی آموزش‌پذیر و دوطرفه‌ای است که بتواند از توزیع مشترک خود، مکان‌ها و اشکال مناسب را برای شیء جدید نمونه‌برداری کند. نمونه‌های ترکیب‌یافته‌ی شی‌ء برای ایجاد تصاویر جدید می‌توانند به‌عنوان ورودی برای روش‌های مبتنی بر شبکه‌ی خصمانه‌ی مولد یا برای بازیابی نزدیک‌ترین بخش از مجموعه داده‌ی موجود استفاده شوند.

آن‌طورکه پژوهشگران توضیح می‌دهند، مولد در این حالت مکان مناسب را برای ایجاد پوشش‌های شیء با مقیاس‌ها و حالت‌ها و شکل‌های «معنادار و هماهنگ»، به‌ویژه چگونگی توزیع اشیاء در صحنه و نحوه‌ی قراردادن طبیعی شیء پیش‌بینی می‌کند تا اشیاء به‌عنوان بخشی از صحنه به‌نظر برسند. سیستم Artificial Intelligence به‌تدریج در مسیر آموزش، توزیع مختلفی را برای هر دسته‌بندی شی‌ء یاد می‌گیرد که در صحنه قرار دارد. برای مثال، هوش مصنوعی این حقیقت را می‌فهمد که در تصاویری از خیابان‌های شهر، مردم معمولا در پیاده‌روها و خودروها اغلب در جاده‌ها حضور دارند.

در آزمایش‌ها، مدل پژوهشگران با ورود واقع‌گرایانه‌ی اشیای شکل‌یافته عملکردی بهتری درمقایسه‌با حالت اولیه از خود نشان داد. وقتی تشخیص‌دهنده‌ی تصویر (YOLOv3) روی تصاویر ساخته‌شده‌ی هوش مصنوعی اجرا شد، می‌توانست اشیای ترکیب‌شده را شناسایی کند. در برآورد کارکنان سرویس ترک مکانیکی آمازون، به‌نحو مؤثرتر ۴۳درصد از شرکت‌کنندگان به این باور رسیدند که اشیای ساخته‌شده‌ی هوش مصنوعی واقعی هستند.

پژوهشگران در انتها می‌نویسند:

این نشان می‌دهد رویکرد ما قادر به انجام وظیفه‌ی ترکیب و ورود اشیاء است. همان‌طورکه روش ما به‌طور مشترک مکان و ظاهر اشیاء را مدل‌سازی می‌کند، برای حل دیگر مشکلات بینایی کامپیوتری نیز می‌تواند به‌کار گرفته شود. یکی از جالب‌توجه‌ترین اقدامات آتی رسیدگی به انسدادهای بین اشیاء خواهد بود.
مقاله رو دوست داشتی؟
نظرت چیه؟
داغ‌ترین مطالب روز
گوشی نوبیا Z70S Ultra Photographer Edition
اولترای تمام‌صفحه؛ پرچمدار متفاوت نوبیا به‌زودی از راه می‌رسد

نوبیا با انتشار تصویر رسمی از نسخه‌ی ویژه‌ی Z70S Ultra، طراحی و برخی مشخصات آن را قبل‌از رونمایی رسمی تأیید کرد.

47
2 روز پیش
ایرانسل
حذف آهنگ پیشواز ایرانسل چگونه انجام می‌شود؟

از آهنگ پیشواز ایرانسل‌تان خسته شده‌اید؟ در این مقاله با ۳ روش بسیار ساده برای حذف آهنگ پیشواز ایرانسل در کمتر از یک دقیقه آشنا می‌شوید.

4
2 روز پیش
افزودن آهنگ به پست اینستاگرام
روش آسان برای افزودن موزیک به پست‌ اینستاگرام

موسیقی می‌تواند حال‌وهوای پست‌های شما را جذاب‌تر کند و با این‌کار سطح تعامل و توجه مخاطبان به محتوای شما افزایش می‌یابد.

4
یک روز پیش
پیگیری تراکنش
چطور انواع تراکنش‌ های بانکی را پیگیری کنیم؟

اگر می‌خواهید بدانید که چطور می‌توانید انواع تراکنش‌های بانکی خود را پیگیری کنید، تا انتهای این مطلب همراه زومیت باشید.

8
11 ساعت پیش
نمای جلو ویدیو پروژکتور شیائومی پروژکتور ۳ لایت
پروژکتور ۲۰۲۵ ردمی با قیمت مناسب و ابعاد جمع‌و‌جور معرفی شد

شیائومی پروژکتور ردمی Projector 3 Lite را با بدنه‌ی جمع‌وجور و وضوح بالا برای بازار چین معرفی کرد.

30
2 روز پیش
رابط کاربری گلکسی S25 اولترا / Galaxy S25 Ultra
کدام گوشی‌ها و تبلت‌های سامسونگ به One UI 8 آپدیت می‌شوند؟

شاید بسیاری از کاربران هنوز منتظر دریافت One UI 7 باشند؛ اما سامسونگ توسعه‌ی One UI 8 را آغاز کرده است.

70
2 روز پیش
چگونه ریپلای اینستاگرام را فعال کنیم؟

در این مقاله‌ی آموزشی، روش فعال‌کردن ریپلای به پیام‌ها در اینستاگرام و دلایل از کار افتادن آن برای برخی از حساب‌ها را شرح خواهیم داد.

20
15 ساعت پیش
تبلیغات
DN-DNShatel

نظرات

با چشم باز خرید کنید
زومیت شما را برای انتخاب بهتر و خرید ارزان‌تر راهنمایی می‌کند
ورود به بخش محصولات