هوش مصنوعی دیپ مایند بالاتر از ۹۹/۹۸ درصد از بازیکنان استارکرافت ۲ قرار گرفت
هوش مصنوعی دیپمایند گوگل که پیشتر موفق به شکست انسان در بازیهای چندنفره شده بود، اکنون با توسعهی سیستم جدیدش توانست حرفهایترین بازیکنان جهان در بازی استراتژی همزمان استارکرافت ۲ را نیز شکست دهد. هوش مصنوعی آلفااستار (AlphaStar AI) برای اولینبار توانست رقابتهای تن به تن را در بازی استراتژیک همزمان سطح Grandmaster با هرسه جناح بازی (Terran, Protoss, Zerg) انجام دهد.
بهگفتهی شرکت دیپمایند، عملکرد این هوش مصنوعی بهتر از ۹۹/۹۸ درصد از بازیکنان انسانی فعال سایت Battle.net بوده؛ همچنین، با شرایط و محدودیتهای یکسان در دنیای واقعی مانند استفاده از نماها و زاویهی دید دوربین مجازی یکسان، اطلاعات محدود نقشه و تعداد اکشنها در هر دقیقه باتوجه به گیمپلی انسانی مدیریت شده است. هوش مصنوعی آلفااستار با ترفند تقلید از نحوهی تمرین کردن بازیکنان حرفهای استارکرافت به کمک نسخهی دستکاریشده سیستم یادگیری تقویتی (Reinforcement Learning) موفق به انجام چنین کاری شده است.
هوش مصنوعی در تمرینات یادگیری تقویتی بهطور معمول بهگونهای تنظیم میشود که شانس برندهشدن خود را به حداکثر برساند، اما این روش برای یک آموزش قوی کفایت نمیکند. نرمافزار فقط ممکن است یاد بگیرد تا خود را درمجموعه شرایطی خاص بهبود بخشد و در معرض سوءاستفاده و آسیبپذیری قرار دهد. تقریبا مانند متخصصان انسانی، رویکرد جدید دیپمایند روی یکی از مولفههای هوش مصنوعی که از روی نقاط ضعف دیگری سوءاستفاده میکند، تمرکز دارد. به این ترتیب، آلفااستار بهتدریج یاد گرفت که استراتژیهای گستردهتری را برای مقابله با تاکتیکهای غیرمتعارف و بسیار استثماری مانند aka cheese انجام دهد.
این فناوری هنوز محدودیتهای خود را دارد؛ بهطوریکه برای شروع به تمرین بسیار بیشتری نسبت به انسان نیاز دارد تا بتواند خود را در سطح قابل مقایسهای از مهارت مطابقت دهد. باتوجه به پیچیدگیهای استارکرافت، این اتفاق کوچکی به شمار نمیرود و برای برنامههای بلندمدت دیپمایند نشانهی خوبی است. همانطور که در تحقیقات بازی قبلی شرکت نیز گفته شده، هدف نهایی، ارائهی نسخهی پیشرفتهی آلفا استار در اپلیکیشنهای دنیای واقعی است، بهطوری که بتوان از رویکردهای مشابه در دنیای واقعی برای حل مشکلات پیچیده یا گسترش تواناییهای هوش ماشینی بهره جست. هوش مصنوعی با مهارت و آموزش قوی و پیشرفتهتر میتواند به کمک رباتها و خودروهای خودران در شرایط غیرمعمول بیایدکه نمیتوان آن را درهیچ شرایطی اداره و مدیریت کرد. پیشتر، ویمو در همکاری با دیپمایند گوگل، از هوش مصنوعی بازی استارکرافت ۲ برای توسعهی شبکههای عصبی خودروهای خودران استفاده کرده است. ویمو یکی از واحدهای شرکت آلفابت، شرکت مادر گوگل است و دیپمایند از این تکنولوژی برای آموزش خودروهای خودران خود استفاده میکند.
نظرات