دستاورد بزرگ گوگل در هوش مصنوعی با شکست بازیکن شناخته شدهی بازی GO
در هفتههای اخیر گوگل اعلام کرد که سیستم هوش مصنوعی توسعه یافته توسط متخصصان این کمپانی موفق شده تا یکی از بازیکنان برجستهی GO را شکست دهد. به روایت ویکیپدیا گو (GO) یکی از قدیمیترین بازیهای تختهای بشر است که با وجود پیروی از قوانین بسیار ساده، بکارگیری استراتژیهای پیچیدهای را می طلبد تا بتوان بر رقیب چیزه شد. انجام این بازی از طریق بکارگیری شهود و استراتژیهای پیچیده یکی از چالشهایی بود که در دهههای اخیر متخصصان در زمینهی هوش مصنوعی را به خود مشغول کرده بود.
در سالهای اخیر متخصصان امر هوش مصنوعی موفق به توسعهی سیستمهایی شدهاند که میتواند در اغلب بازیهای فکری صورت گرفته، انسانها را مغلوب کند. برای مثال میتوان به شطرنج، Scrablle و Othello اشاره کرد. اما تاکنون هیچ یک از سیستمهای هوش مصنوعی موفق نشده بود تا بر بهترین بازیکنان این بازی که قدمتی بیش از ۲۵۰۰ سال دارد، غلبه کند. شاید از خود بپرسید که چرا دستاورد گوگل بسیار اهمیت داشته و تا این اندازه تعیینکنندهی عنوان میشود؟ نگاهی به بینش و پیشبینی کارشناسان حوزهی هوش مصنوعی، دلیلی منطقی بر اهمیت موفقیت هوش مصنوعی گوگل در غلبه بر بهترین بازیکن گو باشد. براساس گمانه زنیهای کارشناسان در این حوزه، پیشبینی شده بود که برای غلبهی ماشین بر بازیکنان گو، باید یک دههی دیگر به انتظار بنشینیم.
رمی کولوم، محقق فرانسوی که یکی از توسعهدهندگان قویترین هوش مصنوعی بازی گو است، در این خصوص چنین اظهار نظر کرده است:
گوگل بسیار زودتر از آن که انتظار آن را داشتم، به این مهم دست یافته است.
محققان در DeepMind که در سال ۲۰۱۴ توسط گوگل خریداری شده، سیستم خود را که قادر است در برابر عوامل انسانی به رقابت بپردازد، در ماه اکتبر در جریان رقابتی که در دفتر گوگل در لندن برگزار شد، به ورطهی آزمایش گذاشتند. سیستم DeepMind که AlphaGo نام دارد، در برابر فان هوی، قهرمان گو در اروپا به رقابت پرداخت و موفق شد پنج مسابقهی متوالی را از قهرمان اروپا برده و به نفع خود به پایان ببرد. این رقابت توسط یک خبرنگار از نشریهی Nature و یکی از مسئولان فدراسیون گو در برتانیا نظارت شده است.
دکتر تانگوی چوارد، از مجلهی نیچر در این خصوص چنین اظهار نظر کرده است:
رقابت و برد هوش مصنوعی گوگل در رقابت با قرمان گو در اروپا را باید یکی از هیجان انگیزترین لحظات در زندگی خود به عنوان یک محقق و خبرنگار عنوان کنم.
آلفاگو علاوه بر آموزش با ۳۰ میلیون حرکت انجام شده در بازی گو، از تقابل با خود نیز نکات جدیدی را یاد میگیرد
نیچر با انتشار مقالهای به تشریح هوش مصنوعی آلفا گوی گوگل پرداخته است. براساس اطلاعات ارائه شده، غول جستجو در این سیستم هوش مصنوعی از فناوری یادگیری عمیق (Deep Learning) استفاده کرده است. محققان گو در مقایسه با سایر سیستمهای هوش مصنوعی توسعه یافته در این رابطه، اقدام به استفاده از روش هوشمندانهتری کردهاند. محققان گوگل مجموعهای از حرکتهای بهترین بازکنان گو را که شامل بیش از ۳۰ میلیون حرکت است، جمع آوری کرده و سیستم هوش مصنوعی مبتنی بر یادگیری عمیق خود را با استفاده از این حرکات آموزش دادهاند تا از این طریق آلفاگو قادر باشد به تنهایی و براساس تصمیمات خود به بازی بپردازد. اما این مرحله را باید قدم اول در مسیر توسعهی یک سیستم هوش مصنوعی خوب خواند که توانایی آن برابر با بهترین بازیکنان گو است. دانشمندان برای بهبود هر چه بیشتر این سیستم، تدبیر هوشمندانهای را در پیش گرفتند. راهحل تقابل هوش مصنوعی توسعه یافته با خودش بود؛ با استفاده از این روش، دانشمندان موفق شدند تا حرکات جدیدی را نیز ثبت کنند و با استفاده از این حرکات آموزش هوش مصنوعی را وارد مرحلهی جدیدتری نمایند. چنین سیستمی قادر شده تا بهترین بازیکن اروپا را شکست دهد.
دمیس هاسابیس، یکی از ناظران توسعهی DeepMind در این خصوص چنین اظهار نظر کرده است:
بزرگترین نتیجهی توسعهی آلفاگو، عدم توسعهی این سیستم با قوانین از پیش تعیین شده است. در عوض این سیستم از روشهای مبتنی بر یادگیری ماشین توسعه یافته و تکنیکهای برد در بازی گو را به خوبی یاد گرفته است.
اما چرا این برد یک دستاورد بزرگ است؟ آیا این دامنهی این برد فقط به بازی گو محدود میشود؟ به طور حتم پاسخ این سوال منفی است. کمپانیهایی نظیر گوگل، مایکروسافت و فیس بوک که سرویسهای آنلاین را در اختیار کاربرانشان قرار میدهند، از یادگیری عمیق برای تشخیص تصاویر و سوژههای موجود در آن، شناسایی کلمات ادا شده و درک زبان طبیعی مورد تکلم استفاده میکنند. تکنیک مورد استفاده در آلفاگو ترکیبی از یادگیری عمیق و روشی است که اصطلاحا از آن با عنوان یادگیری تقویت شده نام برده میشود. چنین تکنیکی میتواند در آینده روش تعامل روباتها با محیط اطراف و درک و پاسخگویی به تحولات پیرامون را در اختیار این موجودات ساخت دست بشر قرار دهد.
هاسابیس میگوید:
این روش میتواند یک ویژگی طبیعی برای رباتها باشد.
هاسابیس همچنین معتقد است که با استفاده از این روش پیشرفت در زمینهی هوش مصنوعی بیش از پیش شتاب خواهد گرفت. وی مطالعه در هوش مصنوعی را برای یافتههایی با کاربردهایی دیگر بسیار مثمر ثمر خوانده است. وی در این خصوص میگوید:
با استفاده از این تکنیک میتوان سیستمهایی را توسعه داد که قادرند میزان دادهی بسیار بزرگتری را مورد بررسی قرار داده و همچنین بسیار بهتر از متخصصان در زمینههای گوناگون به تحلیل و بررسی مسائل بپردازند. این سیستمها هم از نظر عملکرد و هم از نظر بهینگی بسیار بهتر عمل خواهند کرد؛ بطوریکه شاید این سیستمها راهکارهایی را پیشنهاد دهند که حتی به ذهن متخصصان حوزهی مورد نظر خطور نکرده است.
البته در حال حاضر بازی گو اولین دغدغهی ذهنی هاسابیس و همکارانش است. براساس اطلاعات ارائه شده وی در نظر دارد تا پس از شکست قهرمان اروپا در پشت درهای بسته، به سراغ یکی دیگر از بزرگترین بازیکنان جهانی رفته و با وی در یک رویارویی عمومی به رقابت بپردازند. شنیدهها حکایت از این دارد که آلفاگو در میانههای ماه مارس در کرهی جنوبی با لی سدول، یکی از بازیکنان گو که در عرصهی بین المللی دارای عناوین بسیاری است، به رقابت خواهد پرداخت. به گفتهی هاسابیس، لی سدول را باید راجر فدرر دنیای گو بدانیم.
آلفاگو چگونه خود را آموزش میدهد؟
در ابتدای سال ۲۰۱۴ میلادی، برنامهی هوش مصنوعی Coulom که Crazystone نام داشت موفق شد در برابر نوریموتو یودا، بازیکن قهار این رشتهی ورزشی پیروز شود؛ اما موضوعی که باید در این پیروزی اشاره کرد، انجام ۴ حرکت پی در پی ابتدایی در این رقابت توسط برنامهی هوش مصنوعی توسعه یافته بود که برتری بزرگی در بازی گو به شمار میرود. در آن زمان Coulom پیشبینی کرده بود که برای غلبه بر انسان، نیاز به یک بازهی زمانی یک دههای است تا ماشینها بتوانند پیروز رقابت با انسانها در بازی گو باشند.
در بازی شطرنج در هر دور تنها بصورت میانگین ۳۸ احتمال برای حرکت بعدی وجود دارد؛ در حالی که در بازی گو در هر دور بیش از ۲۵۰ احتمال وجود دارد
چالش اصلی در رقابت با بهترین بازیکنهای گو، در طبیعت این بازی نهفته است. حتی بهترین ابررایانههای توسعه یافته نیز برای آنالیز و پیشبینی نتیجهی حرکتهای قابل انجام از نظر قدرت پردازشی دچار تزلرل شده و نمیتوانند قدرت پردازشی مورد نیاز را تامین کنند. در واقع نیروی پردازشی این رایانهها مناسب نبوده و در نتیجه زمان درازی را برای ارائهی نتیجهی قابل قبول مورد نیاز است. زمانی که ابررایانهی موسوم به Deep Blue که توسط IBM توسعه یافته بود، موفق شد تا در سال ۱۹۹۷، گری کاسپاروف، قهرمان شطرنج جهان را شکست دهد، بسیاری به قدرت این ابررایانه پی بردند؛ چراکه این ابررایانه با قدرت زیادی کاسپاروف را شکست داد. علت پیروزی قاطع این دیپ بلو، قدرت بالای این ابررایانه در کنار قدرت تحلیل و نتیجهگیری از هر حرکت احتمالی ممکن در بازی بود که تقریبا هیچ انسانی توانایی انجام آن را ندارد. اما چنین پیشبینیهایی در بازی گو ممکن نیست. براساس اطلاعات ارائه شده در بازی شطرنج، در هر دور، بصورت میانگین میتوان ۳۵ حرکت را انجام داد، اما در بازی گو که بین دو نفر در تختهای به بزرگی ۱۹ در ۱۹ خانه انجام میشود، در هر دور بصورت میانگین میتوان بیش از ۲۵۰ حرکت انجام داد. هر یک از این ۲۵۰ حرکت احتمالی نیز در ادامه ۲۵۰ احتمال دیگر را در پی دارند. هاسابیس به این موضوع اشاره کرده که در بازی گو، به اندازهای احتمال حرکات گسترده است که تعداد آن از اتمهای موجود در جهان هستی نیز بیشتر است.
با استفاده از تکنیک موسوم به درخت مونت کارلو، سیستمهایی نظیر CrazyStone قادرند تا احتمالات بیشتری را محاسبه کرده و چندین مرحله به سمت جلو به پیش بروند. با استفاده از این تکنیک میتوان دامنهی احتمالاتی را که باید محاسبه شوند، بسیار کاهش داد. در نهایت باید به این موضوع اشاره کرد که استفاده از این راهکار باعث می شود تا سیستمهای مبتنی بر هوش مصنوعی بتوانند بر شماری از بهترین بازیکنان گو غلبه کنند؛ اما این شامل بهترین و باهوشترین بازیکن نمیشود. در میان اساتید بازی گو، حرکتهای انجام شده وابسته به تجربه است. این دسته از بازیکنان توصیه میکنند تا در انجام بازی به جای تحلیل هر یک از حرکتهای ممکن، از حالت کنونی تخته برای انجام جرکت بعدی استفاده شود.
پس از موفقیت نسبی سیستم CrazyStone در سال ۲۰۱۴ شماری از متخصصان در سال ۲۰۱۵ شامل دانشمندانی از فیس بوک، دیپ مایند و دانشگاه ادینبورگ استفاده از یادگیری عمیق را برای توسعهی هوش مصنوعی به منظور رقابت در بازی گو را در دستور کار قرار دادند. هدف این محققان، شبیه سازی روند بازی اساتید بازی گو در قالب یک سیستم هوشمند بود.
در شبکههای عصبی سیستم در چارچوب قوانین از پیش تعیین شده تصمیم نمیگیرد؛ بلکه با تحلیل حجم گستردهای از دادهها، تصمیم گیری در یک حوزه را فرا میگیرد
یادگیری عمیق مبتنی بر شبکههای عصبی است که شامل بستر نرمافزاری و سختافزاری که تقریبا ساختاری شبیه به شبکهی نورونهای مغز انسان دارد. سیستمهای مبتنی بر یادگیری عمیق و شبکههای عصبی عملکردی در چارچوب قوانین مشخص ندارند. به بیان بهتر این سیستمها براساس شرایط و قوانین پیشبینی شده برای این شرایط تصمیمگیری نمیکنند؛ بلکه سیستمهای مبتنی بر شبکههای عصبی با تحلیل حجم زیادی از اطلاعات، تلاش میکنند تا روند انجام یک وظیفه را به خوبی یاد بگیرند. برای مثال میتوان با ارائهی تصاویر متنابهی از یک حیوان به شبکهی عصبی آماده شده برای شناسایی سوژه از تصاویر مختلف، آن را برای شناختن حیوان مشخص شده از تصاویر آموزش داد. در صورتی که یک شبکهی عصبی را با دامنهی لغات مناسبی آشنا کنیم، رفته رفته این سیستم یاد میگیرد تا آنچه را که بر زبان جاری می کنیم درک کرده و متناسب با آن به تعامل با ما بپردازد. به همین ترتیب با ارائهی تعداد مناسبی از حرکتها در بازی گو، این سیستم هوش مصنوعی قادر است تا خود به انجام بازی بپردازد.
محققان در دیپ مایند، دانشگاه ادینبورگ و فیسبوک امیدوارند تا با استفاده از شبکههای عصبی، سیستمهایی مبتنی بر شبکههای عصبی توسعه دهند که قادر باشد تا با نگاه کردن به تختهی بازی، همچون انسانها به بازی بپردازند. محققان در فیسبوک موفق شدهاند تا با کنار هم قراردادن تکنیک درخت مونت کارلو و یادگیری عمیق، شماری از بازیکنان را در بازی گو شکست دهد. البته سیستم فیسبوک قادر به برد در برابر CrazyStone و سایر بازیکنان شناخته شدهی این رشتهی ورزشی نشد.
آلفاگو ۵۷ درصد از حرکات بعدی بازیکنان را در بازی گو به درستی پیشبینی میکند
دیپمایند این ایده را بیش از پیش توسعه داد. سیستم هوشمند این کمپانی توسط ۳۰ میلیون حرکت انجام شده توسط بازیکنان قهار آموزش دیده است. براساس اطلاعات ارائه شده سیستم هوشمند دیپمایند قادر است تا در بیش از ۵۷ درصد موارد حرکت بعدی بازیکنان با عوامل انسانی را پیشبینی کند. رکورد پیشین این سیستم ۴۴ درصد بود. پس از آموزش شبکهی عصبی آلفاگو توسط حرکاتی که توسط انسانها انجام شده، متخصصان دیپ مایند، این سیستم را در برابر نسخههای مختلفی از آلفاگو قرار دادند. سیستم آلفاگو در زمان نبرد در شبکهی عصبی، تمام حرکتهایی را که بیشترین نتیجهی مثبت را در پی داشته، ثبت کرده است. رفته رفته این سیستم یاد گرفته که کدام حرکتها سرانجام خوبی داشته و کدامیک نمیتواند نتیجهی درخوری را داشته باشند.
دیوید سیلور یکی از متخصصان دیپ مایند است که در این خصوص چنین اظهار نظر کرده است:
آلفاگو یاد گرفته تا استراتژیهای جدیدی را برای بازی یاد گرفته و روشهای خود را با رقابت با خود، بیش از پیش بهبود بخشد.
براساس اطلاعات ارائه شده توسط سیلور، آلفاگو به همین علت بسیار بهتر از سایر سیستمهای هوش مصنوعی مشابه عمل میکند که از جملهی آن میتوان به CrazyStone اشاره کرد. دانشمندان در مرحلهی بعد نتایج تحقیقات خود را به دومین شبکهی عصبی انتقال دادند. شبکهی عصبی دوم نیز با استفاده از دادههای مورد استفاده در شبکهی عصبی اول، به پیشبینی حرکات و نتیجهی آنها پرداخته است. این فرایند دقیقا شبیه به روندی است که دیپ بلو در مور بازی شطرنج در پیش گرفته است؛ با این تفاوت که آلفاگو در طی فرآیند پیشبینی و سنجش حرکات، به یادگیری نیز پرداخته است. در واقع آلفاگو دقیقا همهی حرکات را پیشبینی و تحلیل نمیکند؛ بلکه با آنالیز دادههای موجود، فرآیند بازی را یاد میگیرد. همین روش باعث شده تا هوش مصنوعی بتواند بهترین بازکن گو در اروپا را شکست دهد.
سخت افزار مورد استفاده
همچون بسیاری از شبکههای عصبی، سیستم DeepMind نیز با استفاده از رایانههایی که با پردازندههای گرافیکی قدرتمند مجهز شدهاند، اجرا میشود. این پردازندههای گرافیکی با هدف رندر بازیها و تصاویر در کنار سایر محتوای گرافیکی توسعه یافتهاند؛ اما کاربرد جدیدی که پتانسیل این پردازندههای گرافیک را نشان میدهد، استفاده از آنها در حوزهی شبکههای عصبی و محاسبات مرتبط با آن است. براساس اطلاعات ارائه شده توسط هاسابیس، سیستم DeepMind قادر است روی رایانهای با چند پردازندهی گرافیکی نیز به خوبی کار کند؛ اما در مسابقهای که آلفاگو در برابر فان هوی برگزار کرد، این سیستم مبتنی بر شبکهی عصبی از وجود شبکههای از رایانهها بهره میبرد که شامل بیش از ۱۷۰ پردازندهی گرافیکی و ۱٫۲۰۰ پردازنده بود. این سیستم بزرگ با استفاده از آموزشهای دیده شده و نتایج کسب شده، در برابر فان هوی، قرار گرفت.
DeepMind از همین سیستم برای رقابت با قهرمان جهان استفاده خواهد کرد. این رقابت در کرهی جنوبی برگزار خواهد شد و تا زمان آغاز مسابقه نیز تیم توسعهدهنده همچنان روی این سیستم کار خواهند کرد.
براساس اطلاعات ارائه شده توسط Coulom، رقابت با قهرمان جهان بسیار سختتر از رقابتی است که آلفاگو در برابر فان هوی انجام داد؛ با این حال Coulom حساب ویژهای را روی DeppMind باز کرده است.
پیش به سوی آینده
اهمیت توسعهی سیستمی نظیر آلفاگو بسیار بالاتر از برد قهرمان جهان در بازی گو است. دانشمندان میتوانند با استفاده از دستاوردهای آلفاگو، این سیستم را در کاربردهای دیگری نظیر روباتیک، تحقیقات علمی به کار ببرند. همچنین باید به استفاده از این سیستم در زمینههای دیگری نظیر دستیارهای صوتی چون سیری برای انجام فعالیتهای سرمایهگذاری و اقتصادی نیز اشاره کرد.
کریس نیکولسون، موسس استارت آپ Skymind که در زمینهی فناوریهای یادگیری عمیق فعالیت میکند، در این خصوص این چنین اظهار نظر کرده است:
از سیستمهای مبتنی بر شبکهی عصبی نظیر آلفاگو میتوان در هر مشکل و مسالهای که تعیین استراتژی برای رسیدن به موفقیت اهمیت دارد، استفاده کرد. کاربردهای این فناوری میتواند از اقتصاد، علم یا جنگ گسترده باشد.
یکی از نکات جالبی که باید در مورد سیستم DeepMind اشاره کرد، عدم وابستگی صرف این سیستم به دادههایی است که توسط توسعهدهندگان آن در اختیارش قرار میگیرد. به بیان بهتر این سیستم لزوما با استفاده از دادههای ایجاد شده توسط انسانها آموزش نمیبیند؛ بلکه آلفاگو قادر است از نتایج کسب شده در رقابت با خود نیز نکات جدیدی را دریافت کرده و یاد بگیرد. در سالهای گذشته بسیاری از متخصصان و صاحب نظران در حوزهی فناوری در مورد توسعهی چنین سیستمهای هوشندی هشدار دادهاند. برای مثال میتوان به ایلان ماسک اشاره کرد که توسعهی چنین سیستمهایی را بسیار خطرناک عنوان کرده است؛ چراکه این سیستمها قادرند با تکنیکهای مستقل یادگیری، به اندازهای پیشرفت کنند که قدرت تفکری بیشتری در مقایسه با انسانها به دست بیاورند.
البته چنین نگرانیهایی متوجه سیستمهایی نظیر آلفاگو نیست؛ چراکه این سیستمها در کنترل توسعهدهندگانش بوده و بیشتر در جنبههایی نظیر انجام بازی گو مورد استفاده قرار میگیرند. هرچند قدرت پردازشی آلفاگو هنوز به اندازهی مغز انسان نیست، اما مسیری که این سیستم برای رشد طی کرده، میتواند تجربیات ارزشمندی را برای پیشرفت هر چه بیشتر در اختیار متخصصان قرار دهد.
گوگل به عنوان یکی از کمپانیهای پیشرو در حوزهی فناوری، سرمایهگذاری عظیمی را در زمینهی توسعهی سیستمهای هوشمند مبتنی بر فناوریهایی نظیر یادگیری عمیق و شبکههای عصبی انجام داده است. حتی بخشی از سرویسهای ارائه شده توسط این غول اینترنتی با تکیه بر توانایی سیستمهای هوشمند این کمپانی ارائه میشود.
هوش مصنوعی یکی از مهمترین فناوریهایی است که برگ برندهی کمپانیها و کشورها در آینده خواهد بود؛ از این رو است که بزرگان دنیای فناوری سرمایههای عظیمی را در این حوزه صرف میکنند. نظر شما در این خصوص چیست؟