هوش مصنوعی دیپ مایند گوگل، نحوه انجام بازیهای ویدیویی را آموزش میبیند
دیپماند، شرکت انگلیسی زیرشاخهی گوگل، بهتازگی شیوهای جدید برای آموزش نحوهی انجام بازیهای ویدئویی به هوش مصنوعی توسعه داده است؛ بدین صورت که بهجای تلاش برای انجام فرآیند طافتفرسای تغذیهی اطلاعات، تنها تعدادی ویدئوی یوتیوب به آنها نمایش داده میشود.
جدیدترین شیوهی آموزشی دیپمایند بهمنظور حل مشکلی که هوش مصنوعی در انجام جستجو و کاوش با آن مواجه میشود، طراحی شده است. عملکرد هوش مصنوعی در اکتشاف مکانهای جدید یا تشخیص مسیر درست بهشدت ضعیف است و توسعهدهندگان هوش مصنوعی در یافتن راههایی برای دادن پاداش به هوش مصنوعی در محیطهایی که امکان موفقیت پایین است، با چالش روبهرو هستند. برای مثال، هوش مصنوعی آلفاگو گوگل با هدف پیروزی در گو (نوعی بازی با قواعد بسیار مشخص) طراحی شد. با این حال، هنگام معرفی بازیهایی همچون پیتفال یا انتقام مونتزوما که هر دو نیازمند اکتشاف هستند، هوش مصنوعی بهسختی میتواند تصمیم بگیرد چه کاری باید انجام دهد.
تصمیم گرفتن برای انسانها یک توانایی بدیهی بهحساب میآید. اگر ما مشغول انجام یک بازی باشیم، میتوانیم به کمک ادراک خود موانع را تشخیص دهیم و مسیر پیش رو را تقریبا بهراحتی پیدا کنیم؛ درحالیکه همین مسئلهی به ظاهر ساده میتواند برای هوش مصنوعی چالش بسیار بزرگی محسوب شود. پژوهشگران در این باره مینویسند:
از آنجایی که شمار مسیرهای عملی ممکن بهصورت نمایی در تعداد تصاویر جداکنندهی پاداشها افزایش مییابد، انجام چنین وظایفی با استفاده از شیوههای اکتشافی ابتدایی ساده عملا غیر ممکن است. برای مثال، دستیابی به پاداش محیط نخست در بازی انتقام مونتزوما تقریبا نیازمند طی کردن ۱۰۰ قدم محیطی است یا به عبارت دیگر ۱۰۰ به توان ۱۸ توالی عمل ممکن.
در حال حاضر، توسعهدهندگان از طریق تغذیهی هوش مصنوعی با مجموعه دادههای عظیمی از تصاویر اطلاعاتی که به نحو بینقصی پیکربندی شدهاند، این مشکل را حل میکنند. با این حال، این رویکرد در موقعیتهایی که چنین مجموعه دادههایی با دقت بالا در دسترس نیستند، کارساز نیست. با شیوهی جدید دیپمایند، هوش مصنوعی در ابتدا تصاویر نویزدار را دریافت میکند و به نحوهی پیکربندی آنها به شکلی که بعدا امکان تولید داده از آنها فراهم باشد، پی میبرد. اگر به این هوش مصنوعی ویدئویی از بازی کردن پیتفال یا انتقام مونتزوما توسط انسان نمایش دهید، میتواند به جداسازی حرکاتی که موجب موفقیت انسان شده است، بپردازد و از آنها تقلید کند.
این مسئله به پژوهشگران امکان میدهد برای انجام سریعتر بازی یا دریافت امتیازهای بیشتر، پاداش تعیین کنند و در عین حال مبنایی را برای شروع آموزش هوش مصنوعی در نظر بگیرند. چنین کاری به سادگی بارگذاری چندین ویدئوی یوتیوب درون شبکهی عصبی انجام میشود؛ زیرا این شیوه، آموزش یکباره را ایجاد میکند.
این فناوری بهمحض آنکه به نحو مناسبی توسعه یابد، میتواند به یک ربات امکان بدهد با بهرهگیری از نشانههای تهیهشده توسط تصاویر مریخنورد، محیطهای جدید نظیر سطح مریخ را بررسی کند یا بهسادگی از طریق تماشای ویدئویی تشریحی در یوتیوب، برای محیطی کاری آموزش داده شود.
نظرات