استفاده از دیپ مایند گوگل برای آموزش خودروهای خودران ویمو
اکنون که بازار ساخت خودروهای خودران داغتر از همیشه است، یافتن راههای جدید برای آموزش شبکههای عصبی روزبهروز مهمتر میشود. این موضوع توسعهدهندگان را واداشته است راههای بسیار مبتکرانهای برای آموزش سریعتر شبکههای خود پیدا کنند. حال بهنظر میرسد که یکی از این روشها، به بازی استارکرافت ۲ (StarCraft II) مربوط میشود.
ممکن است این سؤال برایتان پیش بیاید که یک بازی دهساله چه ارتباطی با آموزش شبکههای عصبی امروزی و مدرن دارد؟ براساس گزارش MIT Technology Review، تکنیکهایی که برای هوشمندتر و سختتر کردن هوش مصنوعی این بازی استفاده میشود، در توسعهی شبکههای عصبی هم بهکار گرفته میشود.
در بازی StarCraft 2 هر بازیکن همزمان با مدیریت منابع خود، باید تعداد زیادی واحد مستقل با تواناییهای منحصربهفرد را کنترل کند و با حریفی مبارزه کند که قصد نابودی او را دارد. انسان این کار پیچیده را بهسادگی انجام میدهد؛ ولی انجام آن برای ماشینها راحت نیست.
اتفاقی که در هوش مصنوعی StarCraft 2 میافتد، این است که سیستم دیپمایند (DeepMind) گوگل از نوعی الگوریتم بهنام «آموزش مبتنیبر جمعیت» برای شبیهسازی فرایند انتخاب طبیعی استفاده میکند. این الگوریتم در ابتدا کارآمدترین واحدها را انتخاب میکند و سپس، نسلهای بعدی را از روی آنها میسازد و بدینترتیب، فرایند یادگیری را کوتاه میکند.
اتفاقی مشابه در ساخت خودروهای خودران هم رخ میدهد. ویمو (Waymo) یکی از واحدهای شرکت آلفابت، یعنی شرکت مادر گوگل است و دیپمایند از این تکنولوژی برای آموزش خودروهای خودران خود استفاده میکند. هنگامی که دادهی جدیدی وارد سیستم میشود، دیپمایند کارآمدترین بخشهای شبکهی عصبی را انتخاب و برای تنظیم فرایندها و یادگیری از آنها استفاده میکند. شبکههای عصبی در وسایل نقلیهی خودران ویمو برای تشخیص اشیاء در جاده و پیشبینی حرکت سایر خودروها و تصمیمگیری برای حرکتهای بعدی استفاده میشود. دیپمایند پس از اعلام همکاری با ویمو در پستی نوشت آموزش این شبکههای عصبی به «هفتهها بهبودبخشی و آزمایش و نیروی محاسباتی عظیم» احتیاج داشت.
متیو دوین، مدیر زیرساخت یادگیری ماشین ویمو، در مصاحبهای با MIT Technology Review گفت:
یکی از مشکلات مهم هنگام استفاده از یادگیری ماشین در سیستمهای صنعتی، قابلیت بازسازی سیستم بهمنظور بهرهگیری از کدهای جدید است. ما باید شبکه را دائما آموزش دهیم و کد را دوباره بنویسیم. وقتی شبکه را دوباره آموزش میدهید، نیاز است کمی پارامترها را تغییر دهید.
گوگل برخی از تکنولوژیهای یادگیری ماشین خود را تجاریسازی کرده؛ اما حالا مدل یادگیری مبتنیبر جمعیت خود را بهطور خاص در وسایل نقلیهی خودران ویمو بهکار گرفته است. ناگفته نماند ویمو ازنظر بسیاری از کارشناسان، پیشرفتهترین برنامهی خودروهای خودران در جهان محسوب میشود و مسیر زیادی از پیشرفت خود را بهصورت شبیهسازیشده طی کرده است.
نظرات