هوش مصنوعی آلفاگو اکنون قویتر از هر زمان دیگری است
گوگل با ۴۰۰ میلیون دلار آزمایشگاه هوش مصنوعی دیپمایند (DeepMind) در لندن را خرید. چهارشنبه اعلام شد که این آزمایشگاه بهطور چشمگیری مشهورترین عامل هوش مصنوعیاش با نام آلفاگو (AlphaGo) را بهبود بخشیده است.
آلفاگو، که الگوریتمی از بازی تختهای کهن چین با نام گو بود و توانست بعضی از بهترین بازیکنان انسانی این بازی را در دنیا شکست دهد، بهتازگی دوباره برنامهریزی و به یک هوش مصنوعی جدیدتر به نام آلفاگو زیرو تبدیل شده است. دمیس هاسابیس، مدیرعامل دیپمایند، در گفتوگویی با خبرنگاران گفت:
آلفاگو زیرو بسیار قویتر شده است.
بازی قدیمی گو بازی ساده و در عین حال پیچیدهای است. تعداد قوانین بازی اندک است، ولی تعداد احتمالات برای حرکات در این بازی بسیار زیاد و بهنوعی بینهایت است. آلفاگو بسیار خوب بود، ولی آلفاگو زیرو چیز دیگری است. آلفاگو زیرو، آلفاگوی معمولی را شسکت داد. آلفاگوی معمولی در ماه مارس سال گذشته توانسته بود لیسدول، قهرمان این بازی را تنها با سه روز تمرین در کره، ۴ بر یک شکست دهد. آلفا گو توانست بعد از ۴۰ روز تمرین، آلفاگو مستری را شکست دهد که کیجی، قهرمان کنونی جهان را در ماه می شکست داده بود.
آلفاگوی جدید بدون نیاز به کمک و اطلاعات انسان، توانست نحوه بازی کردن بازی گو را یاد بگیرد
هاسابیس گفت که آلفاگو زیرو دانش هزاران سالهی انسان را تنها ظرف چند روز به دست آورد و علاوه بر این دانش، استراتژیها و دانش جدیدی را در حوزه حرکات بازی گو کشف کرد. آلفاگو زیرو بدون نیاز به ورودی از طرف انسان، به خودش آموزش داد که چگونه بازی گو را انجام دهد. تفاوت بین هوش مصنوعی آلفاگوی قدیمی و جدید این است که آلفاگوی جدید بدون نیاز به کمک و اطلاعات انسان، توانست نحوه بازی کردن بازی گو را یاد بگیرد.
تمام نسخههای قبلی آلفاگو با استفاده از اطلاعات انسانی که از سایتهای آنلاین دانلود میشد، شروع به تمرین و آموزش (با بازی کردن با افراد غیر حرفهای و حرفهای) میکردند. آنها با تجارب بهدستآمده از هزاران بازی، میتوانستند حرکات افراد ماهر در این بازی را در شرایط و وضعیتهای مختلف پیشبینی کنند. اما آلفاگو زیرو از هیچ اطلاعات انسانی برای این کار استفاده نکرد؛ در عوض خودش یاد گرفت چگونه باید بازی کند.
دیوید سیلور، پژوهشگر اصلی آلفاگو، درمورد یادگیری آلفا زیرو بدون اطلاعات انسانی این گونه توضیح میدهد:
این هوش مصنوعی جدید از روش یادگیری جدیدی استفاده میکند که او را تبدیل به معلم خودش کرده است. این هوش مصنوعی با نوعی شبکه مصنوعی کار میکند که هیچگونه اطلاعاتی در مورد بازی ندارد و پس از انجام هزاران با خودش تمام شرایط محتمل آینده را پیشبینی و به این ترتیب الگوریتم بسیار قویتری برای ادامه بازی پیدا میکند. آلفاگو زیرو پس از انجام هر بازی روش جدیدی را امتحان میکند و هر دفعه قویتر از قبل میشود و تا جایی پیش میرود که میتواند تمامی حرکات احتمالی را پیشبینی کند. این روند همینگونه ادامه مییابد.
این اولین باری نیست که پژوهشگران هوش مصنوعی، الگوریتمی ساختهاند که بدون دادههای انسانی کار کند. شرکت هوش مصنوعی OpenAI که ایلان ماسک در آن یک میلیارد دلار سرمایهگذاری کرده است، در ماه آگوست توانسته بود نوعی هوش مصنوعی بسازد که نحوهی بازی کردن بازی کامپیوتری Defense of the Ancients را بدون ورودی انسانی به خودش آموزش دهد.
آلفاگو زیرو همچنین از قدرت محاسباتی کمتری نسبت به نسخه قبلی خود استفاده میکند و این پیشرفت الگوریتمی به پیشرفتهای بیشتری در این زمینه منجر خواهد شد. پروژهی آلفاگو زیرو پیشرفت مهمی بود که بار دیگر نام پژوهش دیپمایند را وارد مجله علمی Nature کرد.
تبدیل کردن ماشینها به ابرانسان یا انسان فوقالعاده، آن هم بدون ارائهی دادههای انسانی، چالشی بود که مدتها در عرصه هوش مصنوعی ادامه داشت و نیاز بود که این چالش حل شود؛ چراکه دادههای انسانی هم گران بودند و هم غیرقابل اعتماد.
دیوید سیلور، همان کسی که پایگاه Business Insider زمانی او را قهرمان بی نام و نشان دیپمایند خواند، این گونه میگوید:
ما با استفاده نکردن از اطلاعات، ویژگیها و مهارتهای انسانی در هر زمینهای، محدویتهای مربوط به دانش انسانی را حذف کردیم. این نسخه از پروژهی ما با تکیه بر دانش خودساخته در مورد چیزهای ناشناخته توانست استراتژیهای خودش را به کار بندد و راههای جدیدی برای بازی کردن برگزیند. این ویژگی، محصول را خیلی قدرتمندتر از نسخههای قبلی ساخت.
وقتی از هارابیس سؤال شد که هزینه ساخت این پروژه چقدر بوده است، چنین جواب داد:
مشخص کردن مقدار دقیق این هزینه کمی سخت است؛ هرچند این رقم کمی ترسناک است. ۱۵ نفر از افراد برجستهی دیپمایند که حقوق بالایی میگرفتند، بهطور تماموقت روی آلفاگو کار کردند و کمپانی هم از قدرت پردازش گوگل به مقدار زیادی استفاده کرد.
ماشینها با آن چیزی که هالیوود نشان میدهد فاصله زیادی دارند
درست است که پیشرفت آلفاگو زیرو بسیار برجسته و مهم است؛ اما پژوهشگران هنوز راه زیادی در عرصهی هوش مصنوعی در پیش دارند و اوضاع کار آنها با چیزی که در فیلمهای سینمایی هالیوود مثل او (Her) و اکسماشینا میبینیم، متفاوت است.
هرچند در حال حاضر عاملان هوش مصنوعی در زمینههایی مثل بازی پیشرفت کردهاند، ولی در انجام وظایف گوناگون بهطور همزمان مشکل دارند؛ مخصوصا اگر زمینههای وظایف با هم متفاوت باشند. با این وجود دیپمایند در نظر دارد با بکارگیری الگوریتمها در چالشهای علمی دنیای واقعی مثل تاشدگی پروتئین، کاهش مصرف انرژی، جستجو برای مواد جدید یا کشف داروهای جدید وارد عمل شود. هارابیس در جلسهی مطبوعاتی گفت:
ما در تلاشیم تا برای هرکاری الگوریتم یادگیری بسازیم و ساخت آلفاگو زیرو تنها گامی شگفتانگیز به سمت این هدف ما بود. بسیاری از افراد تیم سازنده آلفاگو اکنون در بررسی پروژههای دیگر هستند و سعی میکنند این فناوری را در سایر زمینهها به کار بگیرند.