D1-kifpool

هوش مصنوعی خودآموز در ۴۴ ساعت مهارت حل مکعب روبیک پیدا می‌کند

سه‌شنبه ۵ تیر ۱۳۹۷ - ۰۵:۰۰
مطالعه 4 دقیقه
دیپ‌کیوب سیستم جدید هوش مصنوعی است که توانسته در ۴۴ ساعت و بدون نیاز به دخالت انسان، در این پازل سه‌بعدی به مهارت برسد.
تبلیغات
D4-mci

دیپ‌کیوب (DeepCube) یک سیستم هوش مصنوعی (AI) است که مهارت آن در حل مکعب روبیک با مهارت بهترین حل‌کننده‌های انسانی برابری می‌کند. این سیستم تنها در ۴۴ ساعت و بدون نیاز به مداخله‌ی انسان، توانسته است در این پازل سه‌بعدی کلاسیک مهارت پیدا کند.

به گفته‌ی یکی از مؤلفین این مقاله، یک عامل هوشمند به‌طور کلی باید بتواند مسائل دامنه‌های پیچیده را با حداقل نظارت انسانی حل کند. در واقع برای دستیابی به هوش ماشینی شبه‌انسان باید سیستم‌هایی توسعه داد که قادر به یادگیری باشند و سپس آموخته‌های خود را در کاربردهای زمان واقعی پیاده‌سازی کنند.

حاصل پیشرفت‌های اخیر یادگیری ماشین، سیستم‌هایی بوده است که بدون دانش قبلی به یادگیری و کسب مهارت در بازی‌هایی مثل شطرنج و گو پرداخته‌اند؛ اما این روش‌ها برای مکعب روبیک به‌خوبی تفسیر نشده‌اند. مشکل اینجا است که یادگیری تقویتی (استراتژی به‌کاررفته برای آموزش بازی شطرنج و گو به ماشین‌) به اندازه‌ی کافی مناسب پازل‌های پیچیده نیست. برخلاف شطرنج و گو (بازی‌هایی که تشخیص حرکت خوب یا بد برای سیستم آسان است)، کاملا واضح نیست کدام حرکت AI در تلاش برای حل مکعب روبیک، می‌تواند وضعیت کلی پازل درهم‌ریخته را بهبود دهد. وقتی یک سیستم هوش مصنوعی قادر به تشخیص درستی یا نادرستی حرکتی برای حل پازل نباشد، پاداشی نمی‌گیرد و عدم دریافت پاداش به معنی عمل نکردن یادگیری تقویتی است.

مکعب روبیک

یک مثال از استراتژی دیپ‌کیوب. در حرکت ۱۷ از ۳۰، AI یک گوشه‌ی ۲×۲×۲ می‌سازد و در عین حال گوشه‌ها و لبه‌های مجاور را در یک گروه قرار می‌دهد، این تکنیک قبلا توسط حل‌کننده‌های سرعتی به کار می‌رفت.

مکعب روبیک ساده به نظر می‌رسد ولی احتمال‌های متناوب زیادی ارائه می‌کند. یک مکعب روبیک ۳×۳×۳، فضای حالتی با ۴۳,۲۵۲,۰۰۳,۲۷۴,۴۸۹,۸۵۶,۰۰۰ ترکیب دارد (برابر با ۴۳ کوینتیلیون)، اما تنها یک ترکیب برنده است، یعنی فضایی که هر ۶ وجه مکعب یک‌رنگ باشند. استراتژی‌های یا الگوریتم‌های زیادی برای حل مکعب روبیک وجود دارند. ارنو روبیک یک ماه کامل را صرف اختراع این الگوریتم‌ها کرد. چند سال پیش، ثابت شد کمترین تعداد حرکت‌ها برای حل مکعب روبیک با هر روش تصادفی، ۲۶ حرکت است.

 از زمان پیدایش مکعب روبیک در سال ۱۹۷۴، اطلاعات زیادی در مورد این پازل سه‌بعدی و روش حل آن به دست‌ آمده است، اما ترفند واقعی جست‌وجوی هوش مصنوعی این است که ماشین بدون استفاده از اطلاعات تاریخی بتواند مسئله را حل کند. یادگیری تقویتی می‌تواند به حل این مسئله کمک کند؛ اما همان‌طور که اشاره شد، این استراتژی برای مکعب روبیک عملکرد خوبی ندارد. یک تیم پژوهشی از دانشگاه ایروین کالیفرنیا برای غلبه بر این محدودیت به توسعه‌ی یک روش جدید AI معروف به تکرار یادگیری خودکار (Autodidactive Itereation) پرداخته است. به گفته‌ی پژوهشگرهای این بررسی:

برای حل مکعب روبیک با استفاده از یادگیری تقویتی، الگوریتم یک روش را یاد می‌گیرد. این روش حرکت‌ مربوط به هر حالت مشخص را تعیین می‌کند.

دیپ‌کیوب برای فرمول‌بندی این روش، سیستم داخلی پاداش‌های خود را می‌سازد. این سیستم بدون هیچ کمک خارجی و با تغییرات مکعب به‌عنوان ورودی، به ارزیابی حرکات خود می‌پردازد؛ اما این کار را به یک روش هوشمندانه (البته متمرکز بر تلاش) انجام می‌دهد. وقتی AI حرکتی را انجام می‌دهد، در واقع از تمام مسیرهای مربوط به مکعب کامل پرش می‌کند و به سمت هدف مورد نظر برمی‌گردد. به این صورت سیستم می‌تواند توان و کارآیی کلی حرکت را ارزیابی کند و زمانی که داده‌های کافی مرتبط با موقعیت فعلی خود را به دست آورد، از یک روش جست‌وجوی درختی سنتی استفاده می‌کند که تمام حرکت‌های احتمالی را بررسی و بهترین حرکت را برای حل مکعب انتخاب می‌کند. البته این سیستم بهترین راه‌ حل نیست اما به رسیدن به پاسخ کمک می‌کند.

کمترین تعداد برای حل مکعب روبیک، ۲۶ حرکت است

پژوهشگرها با رهبری استفن مک الیر، فارست اگوستینلر و الکساندر شماکف، با استفاده از ۲ میلیون تکرار مختلف در ۸ میلیارد مکعب (شامل بعضی تکرارها) به آموزش دیپ‌کیوب پرداختند و این سیستم هوش مصنوعی روی یک ماشین با سرور ۳۲ هسته‌ای Intel Xeon E5-2620 با سه GPU NVIDIA Titan XP به مدت ۴۴ ساعت آموزش دید.

این سیستم در طول فرآیند آموزشی موفق شد بخشی زیادی از اطلاعات مکعب روبیک را به دست آورد؛ این اطلاعات شامل یک استراتژی است که حل‌کننده‌های سرعتی معمولا از آن استفاده می‌کنند، در این تکنیک گوشه‌ها و لبه‌های مکعب قبل از قرارگیری در موقعیت صحیح خود با یکدیگر منطبق می‌شوند. به گفته‌ی مؤلفان:

الگوریتم ما قادر به حل ۱۰۰ درصد از مکعب‌های درهم‌ریخته‌ی تصادفی است و در عین حال به یک طول میانه‌ی ۳۰ حرکتی دست پیدا می‌کند (کمتر یا مساوی با حل‌کننده‌هایی که از دانش دامنه‌ای انسانی استفاده می‌کنند). این سیستم هنوز نیاز به بهبود و پیشرفت دارد؛ زیرا دیپ‌کیوب در یک زیرمجموعه‌ی کوچک از مکعب‌ها دچار مشکل می‌شود و راه‌ حل‌هایی تولید می‌شود که حل آن‌ها نیازمند زمانی طولانی است.

پژوهشگرها با نگاهی به جلو به دنبال تست یک روش جدید استنتاجی خودکار در مکعب‌های دشوارتر با ۱۶ وجه هستند. از نظر کاربردی از این پژوهش می‌توان برای حل مسائل زمان واقعی مثل پیش‌بینی شکل سه‌بعدی پروتئین‌ها استفاده کرد. تاخوردگی پروتئینی هم مثل مکعب روبیک یک مسئله‌ی بهینه‌سازی ترکیبی به شمار می‌رود؛ اما به‌جای محاسبه‌ی حرکت بعدی، سیستم توالی مناسب آمینواسیدها را در یک شبکه‌ی سه‌بعدی پیش‌بینی می‌کند. حل پازل‌ یک عمل مفید و بهینه است، اما هدف نهایی از ساخت چنین سیستمی، حل مسائل دشوار جهان واقعی مثل کشف‌های دارویی، تحلیل DNA و ساخت‌ ربات‌هایی است که بتوانند در یک دنیای انسانی به فعالیت بپردازند.

مقاله رو دوست داشتی؟
نظرت چیه؟
داغ‌ترین مطالب روز
ردیابی گوشی سامسونگ
چطور گوشی سامسونگ گم‌شده یا سرقتی را پیدا کنیم؟

اگر گوشی سامسونگ شما به‌سرقت رفته یا آن را گم کرده‌اید، از طریق Find My Mobile و سایر امکانات دیگر آن، می‌توانید تلفن خود را بیابید.

36
5 ساعت پیش
نمایشگر پوکو ایکس ۶ پرو | Poco X6 Pro
هیولای بعدی پوکو با پردازنده پرچمدار رؤیت شد؛ رونمایی گوشی نزدیک است

گوشی جدید پوکو در بنچمارک هوش مصنوعی گیک‌بنچ با عملکرد خیره‌کننده ظاهر شد.

64
یک روز پیش
نمای سه‌چهارم جلو خودرو تویوتا bZ3X
ارزان‌ترین شاسی‌بلند برقی تویوتا با ظاهر جذاب و امکانات متنوع رونمایی شد

تویوتا از ارزان‌ترین خودرو شاسی‌بلند خود برای بازار چین با ظاهری جذاب و قابلیت‌های پیشرفته‌ی رانندگی خودکار رونمایی کرد.

15
یک روز پیش
نمای سه چهار جلو کانسپت Journeo چری
خودرو جدید چری متعلق به آینده است؛ رونمایی کانسپت Journeo

چری کانسپت ون جدید خود با نام Journeo را به‌عنوان یک‌ گزینه‌ی لوکس برای مسافرت و کمپینگ با قابلیت‌های آفرودی معرفی کرد.

14
یک روز پیش
اینستاگرام زومیت
چگونه دایرکت اتوماتیک اینستاگرام را فعال کنیم؟

تصور کنید که دایرکت‌ها به‌طور خودکار پاسخ داده شوند و شما همیشه در دسترس باشید. دایرکت اتوماتیک اینستاگرام می‌تواند این کار را برای شما انجام دهد.

3
7 ساعت پیش
افزایش عمر باتری لپ تاپ
بهترین برنامه‌ های بهینه سازی باتری گوشی سامسونگ و گوشی‌ های اندرویدی

با برنامه‌های بهینه ساز باتری گوشی سامسونگ و گوشی‌های اندرویدی آشنا شوید و به پاسخ سوأل «آیا بهینه سازی باتری برای گوشی ضرر دارد؟» برسید.

12
یک روز پیش
چگونه فضای ذخیره سازی و اشغال شده در تلگرام را مدیریت کنیم؟

چگونه می‌توانیم با مدیریت فضای ذخیره‌سازی تلگرام، اشغالِ حافظه گوشی را در درازمدت کنترل کنیم تا از حدی فراتر نرود؟

2
یک روز پیش
تبلیغات
DN-DNShatel

نظرات

با چشم باز خرید کنید
زومیت شما را برای انتخاب بهتر و خرید ارزان‌تر راهنمایی می‌کند
ورود به بخش محصولات