سیستم ادراکی روباتیک دانشگاه برکلی اجسام را با لمس آن‌ها شناسایی می‌کند

چهارشنبه ۲۲ اسفند ۱۳۹۷ - ۲۳:۰۰
مطالعه 4 دقیقه
دانشمندان دانشگاه برکلی موفق شده‌اند نوعی سیستم ادراکی هوش مصنوعی برای ربات‌ها بسازند که می‌تواند اشیا‌ء را با لمس‌کردن آن‌ها شناسایی کنند.
تبلیغات

این واقعیتی ثابت شده است که انسان‌ها خیلی از دانسته‌های خود درباره‌ی جهان پیرامون را ازطریق لمس‌کردن می‌آموزند. پژوهش‌ها نشان می‌دهند یادگیری حرکتی‌لمسی باعث تقویت نتایج یادگیری، حتی در کسانی می‌شود که آموزش به سایر سبک‌های دیداری یا شنیداری یا خواندن‌ونوشتن را ترجیح می‌دهند. یادگیری حرکتی‌لمسی نوعی سبک یادگیری است که دانش‌آموزان در آن به‌جای گوش‌دادن به معلم یا نگاه‌کردن به کارهایی که وی انجام می‌دهد، درگیر انجام فعالیت‌های فیزیکی می‌شوند.

دانشمندان دانشگاه کالیفرنیا در برکلی با الهام‌گرفتن از حس لامسه‌ی انسان‌ها، نوعی سیستم ادراکی برای ربات‌ها طراحی کردند که نتیجه‌ی آن بیشتر متکی به قابلیت لمس‌کردن اشیاء است، نه توانایی مشاهده‌کردن آن‌ها. آن‌ها با مبنا قراردادن کار پژوهشگران دانشگاه کارنگی ملون، نوعی سیستم هوش مصنوعی (AI) طراحی کردند که بتواند رابطه‌ی بین مشاهد‌ه‌های فیزیکی و  شیئی خاص را تشخیص دهد.

مقاله‌ی آنان با عنوان «یادگیری برای شناسایی اشیاء با لمس آن‌ها: تشخیص لمسی ازطریق تطبیق چندحالتی» در Arxiv.org منتشر شده است. در این مقاله، این دانشمندان توضیح می‌دهند:

این پژوهش نخستین گام امیدوارکننده در مسیر ساختن سیستمی ادراکی است که بتواند مانند انسان‌ها، اشیاء را فقط با لمس‌کردن آن‌ها شناسایی کنند

انسان‌ها به‌طور طبیعی می‌توانند رابطه‌ی بین ظاهر و ویژگی‌های مادی اشیاء را در حالت‌های مختلف تشخیص بدهند. ادراک ما ماهیتی چندحالتی دارد. وقتی اسباب‌بازی نرمی می‌بینیم، آنچه انگشتانمان در زمان لمس سطح نرم حس خواهد کرد، در ذهن تصور می‌کنیم یا وقتی لبه‌های قیچی را حس می‌کنیم، می‌توانیم آن‌ها را در ذهنمان تجسم کنیم. آنچه در ذهن ما نقش می‌بندد، فقط هویت آن‌ها نیست؛ بلکه شکل و اندازه‌ی حدسی و نسبت‌های آن‌ها را هم می‌بینیم. در این پروژه، میزان دقت در فراگیری روابط چندحالتی حاصل از لمس روباتیک را بررسی می‌کنیم.

حرف‌زدن درباره‌ی این کار خیلی آسان‌تر از انجام‌دادنش بود. به‌گفته‌ی پژوهشگران، حسگرهای لمسی از قدرت دید همه‌جانبه‌ی حسگرهای تصویری برخوردار نیستند و فقط باتوجه‌به ویژگی‌های سطحی محلی عمل می‌کنند. همچنین، تفسیر یافته‌های آن‌ها کار سخت‌تری است. آن‌ها برای برطرف‌کردن این محدودیت و مواردی مشابه آن، حسگر لمسی GelSight با رزولوشن بالا را با شبکه‌ی عصبی پیچشی (Convolutional Neural Network) ترکیب کردند که نوعی هوش مصنوعی برای تحلیل تصاویر بصری است. حسگر لمسی GelSight با استفاده از دوربینی که تغییرشکل‌های ناشی از لمس شیء را مشاهده می‌کند، تولید اطلاعات را شروع می‌کند. دانشمندان دو حسگر GelSight را روی انگشتان گریپر (Gripper) نصب کردند تا علاوه‌بر داده‌های به‌دست‌آمده از مشاهده‌های دوربین، در‌صورتی‌که گریپر موفق شد انگشتان خود را دور شیء هدف حلقه کند، یافته‌های حاصل از تماس‌های حسگر لمسی را نیز جمع‌آوری کنند.

robotic arm

روی‌هم‌رفته، پژوهشگران موفق شدند نمونه‌هایی از ۹۸ شیء مختلف به‌دست بیاورند که از ۸۰ شیء آن (شامل ۲۷,۳۸۶ مثال) برای آموزش شبکه‌ی عصبی استفاده کردند. ۱۸ نمونه و ۶,۸۴۴ مثال دیگر هم برای آزمایش‌ها نگه داشته شدند. در آزمایش‌ها، سیستم‌های هوش مصنوعی توانستند در ۶۴.۳ درصد از موارد به‌درستی هویت اشیا‌ی مختلف را با لمس آن‌ها تشخیص بدهند. این آمار حتی مواردی را هم شامل می‌شود که در زمان آموزش، خود با آن‌ها روبه‌رو نشده بودند. افزون‌براین، پژوهشگران ادعا می‌کنند سیستم مذکور عملکرد خیلی بهتری درمقایسه‌با روش‌های مشابه داشته است؛ ازجمله روشی که دانشجویان کارشناسی دانشگاه برکلی به‌کار گرفتند و از ۱۱ انسان داوطلب در ۴۲۰ آزمایش خواستند تا اشیاء را با نگاه‌کردن به حالت انگشتانشان، با این فرض حدس بزنند که اشیاء در دستان آن‌ها است.

پژوهشگران معتقدند می‌توان این پروژه را بهبود بخشید. همه‌ی تصاویری که آن‌ها در آزمایششان استفاده کردند به یک محیط متعلق بودند. آنان به این نکته اشاره می‌کنند که کارشان فقط باتوجه‌به یافته‌های فردی انجام شد و به تعاملات حسی چندگانه توجهی نکردند؛ اما بازهم مدعی هستند که این پژوهش نخستین گام امیدوارکننده در مسیر ساختن سیستم‌های ادراکی هوش مصنوعی است که می‌توانند مانند انسان‌ها، اشیاء را فقط با لمس‌کردن شناسایی کنند.

در مقاله‌ی آن‌ها آمده است:

تکمیل رویکرد پیشنهادی ما درباره‌ی لمس روباتیک، مسیری پرهیجان را برای پژوهش‌های آتی خواهد گشود. اگر ربات‌ها این توانایی را داشته باشند که اجسام را فقط با لمس آن‌ها شناسایی کنند، می‌توانیم ربات‌های کارگری را تجسم کنیم که کالاها را فقط از روی تصاویر حاصل از لمس آن‌ها روی قفسه‌های انبار شناسایی می‌کنند یا ربات‌های خدمت‌کاری که وسایل خانه را از محل‌های دورازدسترس به‌دست می‌آورند و شاید با استفاده از آموزش‌های چندحالتی، درکی عمیق‌تر از ویژگی‌های اشیاء داشته باشند.
مقاله رو دوست داشتی؟
نظرت چیه؟
داغ‌ترین مطالب روز
تبلیغات

نظرات