نابغه هوش مصنوعی گوگل از نوآوری جدیدی در شبکههای عصبی رونمایی کرد
اگر میخواهید یک نفر را به خاطر هیاهوی موجود پیرامون هوش مصنوعی سرزنش کنید، جف هینتون، پژوهشگر ۶۹ سالهی گوگل، یکی از گزینههای خوب برای این کار به شمار میرود.
این استاد بااستعداد دانشگاه تورنتو، در اکتبر ۲۰۱۲ این حوزه را وارد مسیر تازهای کرد. هینتون با همراهی دو دانشآموختهی دیگر، نشان داد که شبکههای عصبی مصنوعی، فناوری غیر معمولی که برای دههها مشغول پشتیبانی از آن بود، میتوانند پیشرفت بزرگی در توانایی ماشینها برای درک تصاویر فراهم کنند. این سه پژوهشگر، ظرف ۶ ماه در فهرست حقوقبگیران گوگل قرار گرفتند. امروزه شبکههای عصبی از گفتار ما رونویسی میکنند، حیوانات خانگی ما را تشخیص میدهند و با ترولهای اینترنتی مقابله میکنند.
اما هینتون در حال حاضر از همان فناوری که نقش اصلی را در پدید آوردنش داشت، انتقاد میکند. وی میگوید:
من عقیده دارم که نحوهی استفادهی ما از بینایی کامپیوتری واقعا اشتباه است. این شیوه در حال حاضر بهتر از هر روش دیگری جواب میدهد؛ اما این به معنی درستی آن نیست.
هینتون از ایدهی قدیمی دیگری رونمایی کرده است که نحوهی مشاهده و تغییر شکل هوش مصنوعی توسط کامپیوترها را دگرگون میکند. این ایده به علت اهمیت حیاتی بینایی کامپیوتری در زمینههایی همچون خودروهای خودران و تهیهی نرمافزاری که نقش پزشک را برعهده بگیرد، موضوعی مهم بهحساب میآید.
اواخر ماه گذشته، هینتون با انتشار دو مقالهی تحقیقی اعلام کرد ایدهای که نزدیک به ۴۰ سال در نظر داشته، نتیجهبخش بوده است. او میگوید:
مدت بسیار زیادی این ایده برای من کاملا قابل درک بود و اکنون نهتنها عملکرد آن رضایتبخش است؛ بلکه ما سرانجام به چیزی دست یافتهایم که چنین عملکردی دارد.
رویکرد جدید هینتون به نام «شبکههای کپسولی» شناخته میشود. این رویکرد یک نوآوری در شبکههای عصبی است و قصد دارد توانایی ماشین را در درک جهان از طریق تصویر یا ویدئو بهبود ببخشد. در یکی از مقالاتی که ماه گذشته منتشر شد، دقت شبکههای کپسولی هینتون با بهترین تکنیکهای موجود در یک آزمایش استاندارد با عنوان «نحوهی یادگیری نرمافزار برای تشخیص ارقام دستنویس» مطابقت داشت.
در مقالهی دوم، شبکههای کپسولی بهترین نرخ اشتباه پیشین در آزمایشی که توانایی نرمافزار در تشخیص اسباببازیهایی نظیر کامیون و خودرو را از زوایای مختلف به چالش میکشد، تقریبا به نصف رساند. هینتون به همراه همکارانش، سارا سبور و نیکولاس فراست در دفتر تورنتوی گوگل مشغول کار روی تکنیکهای جدید خود است.
شبکهی کپسولی قصد دارد ضعف امروزی سیستمهای یادگیری ماشینی را که منجر به محدودیت در کارایی آنها میشود، رفع کند. نرمافزار تشخیص تصویری که امروزه توسط گوگل و دیگر شرکتها به کار گرفته میشود، نیازمند تعداد بسیار زیادی تصویر نمونه است تا به نحو قابل اطمینانی نحوهی تشخیص اشیاء را در هر وضعیتی یاد بگیرد. این موضوع بدین خاطر است که نرمافزار در تعمیم معلومات خود به سناریوهای جدید عملکرد تقریبا ضعیفی دارد. برای مثال، اگر یک شیء را از زوایای جدید به نرمافزار نشان دهیم، نمیتواند دریابد که این همان شیء پیشین است.
برای آنکه به کامپیوتر یاد بدهیم یک گربه را از زوایای گوناگون تشخیص دهد؛ نیازمند هزاران تصویر از گربه در حالتهای مختلف خواهیم بود. درحالیکه یک کودک برای آنکه نام حیوان خانگی را یاد بگیرد، نیازمند چنین آموزش مشخص و گستردهای نخواهد بود.
ایدهی هینتون برای از میان برداشتن شکاف بین بهترین سیستمهای هوش مصنوعی و انسانهای خردسال، قرار دادن قدری دانش بیشتر از جهان در نرمافزار بینایی کامپیوتری است. کپسولها که دستههای کوچکی از نورونهای مجازی هستند، بهمنظور ردیابی اجزای مختلف یک شیء نظیر بینی و گوشهای یک گربه و موقعیتهای نسبی آنها در فضا طراحی شدهاند. یک شبکهی متشکل از کپسولهای فراوان میتواند با بهکارگیری این آگاهی، دریابد هنگامی که صحنهای جدید از یک شیء میبیند؛ نه یک شیء جدید، بلکه در واقع تنها منظرهای جدید از همان شیء مشاهده میکند.
هینتون در سال ۱۹۷۹ - هنگامی که در تلاش برای آگاهی از این موضوع بود که چگونه انسانها از تصاویر ذهنی استفاده میکنند - به این نتیجه رسید که سیستمهای بصری نیازمند چنین ادراک حسی هندسی هستند. وی در ابتدا در سال ۲۰۱۱ از یک طراحی اولیه برای شبکههای کپسولی رونمایی کرد. پژوهشگران این حوزه، برای مدتها در انتظار تصویر کاملتری بودند که دو هفتهی پیش از آن رونمایی شد. کیانهان چو، استاد دانشگاه نیویورک که از پژوهشگران تشخیص تصویر محسوب میشود، میگوید: «همه منتظر این [نوآوری] و به دنبال دورخیز بزرگ بعدی جف بودند.»
هنوز برای تشخیص بزرگی قدم برداشتهشده توسط هینتون بسیار زود است و خودش نیز این را میداند. این کهنهکار عرصهی هوش مصنوعی ترجیح میدهد به جای افتخار به اینکه ایدهاش اکنون توسط شواهد پشتیبانی میشود؛ به شرح این موضوع بپردازد که عملکرد شبکههای کپسولی هنوز نیازمند اثبات با مجموعهی تصاویر بزرگ است و پیادهسازی فعلی آن در مقایسه با نرمافزار تشخیص تصویر رایج، سرعت پایینی دارد.
هینتون امیدوار است که بتواند این کمبودها را برطرف کند. دیگر افراد فعال در حوزهی هوش مصنوعی نیز دربارهی تکامل ایدهی او در درازمدت امیدوار هستند.
رولان ممیزویچ، همبنیانگذار استارتاپ تشخیص تصویر توونتی بیلیون نورونز و استاد دانشگاه مونترال، میگوید طراحی اولیهی هینتون در مقایسه با سیستمهای موجود، باید قادر به استخراج ادراک بیشتری از یک مقدار دادهی مشخص باشد. اگر عملکرد این ایده در اندازهی مورد نیاز ثابت شود؛ بهکارگیری آن میتواند در حوزههایی نظیر مراقبتهای بهداشتی که دادهی تصویری برای آموزش سیستمهای هوش مصنوعی بسیار کمیاب است، سودمند باشد.
از برخی جنبهها، شبکههای کپسولی یک انشعاب از جریان اخیر در هوش مصنوعی بهحساب میآیند. یک تفسیر از موفقیت اخیر شبکههای عصبی این است که انسانها تا حد ممکن باید دانش کمتری در نرمافزار هوش مصنوعی رمزنگاری کنند و در عوض آن را وادار کنند تا خود مسائل را از ابتدا دریابد. گری مارکوس، استاد روانشناسی در دانشگاه نیویورک که سال گذشته اقدام به فروش یک استارتاپ هوش مصنوعی به اوبر کرد، میگوید اقدام اخیر هینتون نشاندهندهی یک تنفس خوشایند از هوای تازه است. مارکوس استدلال میکند که پژوهشگران هوش مصنوعی باید اقدامات بیشتری در راستای شبیهسازی چگونگی کارکرد مغز و توانایی ذاتی آن برای یادگیری مهارتهای حیاتی نظیر بینایی و زبان انجام دهند. وی میگوید:
هنوز بسیار زود است که پیشبینی کنیم این ساختار مشخص تا کجا پیش خواهد رفت؛ اما تماشای اینکه هینتون مشغول شکستن چارچوبی است که ظاهرا این حوزه را در بر گرفته، فوقالعاده است.
نظرات