بالنهای اینترنت گوگل به لطف هوش مصنوعی میتوانند یک سال در حالت پرواز باقی بمانند
گوگل اعتقاد دارد با استفاده از الگوریتمهای پیشرفتهتر و دقیقتر میتوان پرواز بالنهای غولآسای پرشده از گاز هلیوم را بهبود بخشید. به نظر میرسد این ایده برای گوگل جواب داده است و این شرکت واقعا توانسته پرواز بالنهای غولآسایش را که سرویس اینترنت ارائه میدهند بهبود دهد.
طی چند سال اخیر، پروژهی لون (Project Loon) که یکی از زیرمجموعههای آلفابت (شرکت مادر گوگل) محسوب میشود در تلاش بوده است تا دسترسی به اینترنت را در مناطق غیر شهری و دورافتادهی جهان ممکن کند. لون برای دستیابی به این هدف، سراغ بالنهایی رفته است که در ارتفاع زیاد در استراتوسفر به پرواز درمیآیند و به لطف آنها نوعی شبکهی بیسیم هوایی ایجاد میشود.
سال گذشتهی میلادی، لون اعلام کرد ناوگان بالنهایش از رکورد یک میلیون ساعت پرواز در استراتوسفر عبور کرده است. در پایان ماه اکتبر ۲۰۲۰ (اوایل آبان ۱۳۹۹)، لون رکورد دیگری در زمینهی طولانیترین پرواز در استراتوسفر ثبت کرد و بالنهایش به مدت ۳۱۲ روز در هوا معلق باقی ماندند. اینطور که لون میگوید، این بالنها مسافتی در حدود ۱۳۵ هزار مایل (۲۱۷,۲۶۱ کیلومتر) را پوشش میدهند.
در مقالهی جدیدی که بهتازگی در مجلهی Nature منتشر شده است، لون توضیح میدهد که بالنها چگونه میتوانند هر بار تا چندین هفته در هوا معلق بمانند و به فعالیت ادامه دهند. نکتهی جالب این است که بالنها میتوانند بدون دخالت انسان و حتی بدون آگاهی کامل از بادهایی که در استراتوسفر میوزد همچنان پرواز کنند. راز موفقیت لون چیست؟ از قرار معلوم لون به شکلی گسترده از فناوریهای بهروز هوش مصنوعی استفاده میکند.
سال کاندیدو، مدیر ارشد واحد فناوری لون، به خبرگزاری دیجیتال ترندز میگوید بالنهای این شرکت ارتفاعشان را افزایش یا کاهش میدهند تا بتوانند در معرض جریانهای مطلوب باد قرار بگیرند که باعث میشود در جهت مورد نظر حرکت کنند. تصمیم برای زمان بالا یا پایین رفتن بالنهای لون توسط «الگوریتمهایی پیچیده» گرفته میشود و ظاهرا انسان دخالتی در این موضوع ندارد.
گوگل با بهرهگیری از هوش مصنوعی، سیستم ناوبری برای بالنهای اینترنت طراحی میکند
بهطور سنتی الگوریتمهای مورد بحث توسط انسان طراحی میشوند؛ اما مدیر ارشد فناوری لون میگوید این شرکت به کمک تکنیک یادگیری تقویتی (Reinforcement Learning)، از هوش مصنوعی بهمنظور ساخت الگوریتم بهره میگیرد. سال کاندیدو ادامه میدهد: «اساسا دستگاهی میسازیم که میتواند بهتر از ما انسانها، سیستم ناوبری را طراحی کند. دستگاه مورد بحث، فرایند ساخت سیستمهای ناوبری را در زمانی کوتاهتر از انسان به انجام میرساند.»
یادگیری تقویتی یکی از زیرشاخههای فناوری یادگیری ماشین (Machine Learning) محسوب میشود و به شکلی عمده از مکتب رفتارگرایی در روانشناسی الهام گرفته است. رهنمود اصلی یادگیری تقویتی یک ایدهی خاص است که براساس آن، اپراتورهای نرمافزاری میتوانند با حداکثر پاداش تعیینشده، یاد بگیرند که اقدامات لازم را انجام دهند.
بارها در رسانهها گفته شده که واحد دیپ مایند (DeepMind) گوگل از یادگیری تقویتی برای تعلیم دادن نوعی هوش مصنوعی استفاده کرده است. هوش مصنوعی دیپ مایند صرفا با استفاده از پیکسلهایی که هر کدام از فریمهای بازیهای کلاسیک آتاری را ساختهاند و همچنین امتیاز روی صفحه، امکان تجربهی این بازیها را فراهم میکند. با به حداکثر رساندن امتیاز، دیپ مایند که از طریق آزمون و خطا یاد گرفته است بازیها را اجرا کند، به حدی مهارتهایش را تقویت میکند تا در آن بازی خبره شود.
البته به پرواز درآوردن بالن با این هدف که از مسیر مورد نظر منحرف نشود و همچنان به خدمترسانی ادامه دهد، بسیار متفاوت با اجرای بازی ویدئویی است و پیچیدگی بیشتری دارد. سفر موفقیتآمیز بالن در آسمان، با تخصیص امتیازی خاص همراه نمیشود. در واقع امتیازی وجود ندارد که به ما نشان دهد پرواز بالن موفقیتآمیز انجام شده است. اما به گفتهی کاندیدو، تکنیک یادگیری تقویتی بخشی حیاتی از موفقیت لون محسوب میشود و نمیتوان از کنار نقش مهم آن بهسادگی عبور کرد.
تکنیک یادگیری تقویتی، بخشی حیاتی از موفقیت پروژهی لون گوگل است
کاندیدو میگوید یادگیری تقویتی میتواند حجم عظیمی از اطلاعات را در زمانی کوتاه پردازش کند و از نتایجِ بهدستآمده در راستای حل کردن مسائل بهره بگیرد. این درحالی است که انسان بهطور ذاتی در ابتدا باید بفهمد چگونه به اطلاعاتی که به دست آورده است واکنش نشان دهد و همین موضوع زمانبر است. از آنجایی که سیستم ناوبری لون با درنظرگرفتن تعداد زیادی فاکتور و اطلاعات و داده بهبود پیدا میکند، از پیچیدگی کارِ نهایی کاسته میشود.
با استفاده از یادگیری تقویتی و براساس دانشی که از تاریخچهی وزش باد در مناطق در دسترس قرار دارد، بالنهای شرکت لون که از هوش مصنوعی قدرت میگیرند میتوانند تصمیماتی مطلوب برای نحوهی حرکت کردن بگیرند. البته فاکتورهای دیگری روی تصمیم بالنها برای حرکت کردن اثرگذار هستند که شامل بادهای مشاهدهشده و پیشبینیشده و همچنین مسیرهای پیشبینیشده برای پرواز در آینده میشود. تمامی این دادهها بهدقت مورد بررسی قرار میگیرند و پیش از اتخاذ تصمیم نهایی توسط بالن، سناریوهای مختلف شبیهسازی میشوند.
سیستم جدید مبتنی بر یادگیری تقویتی، در مقایسه با سیستمهایی که پیشتر برای کنترل بالنهای لون مورد استفاده قرار میگرفتند به شکلی مؤثرتر عمل میکنند و باعث میشوند بالنها به شکلی بهتر در محدودهی ایستگاه زمینی فعالیت کنند تا سیگنالها را بهخوبی دریافت و ارسال کنند. استفاده از سیستم جدید باعث میشود زمانیکه بالن از مسیر اصلیاش خارج شد، سریعتر از قبل به مسیر بازگردد.
کاندیدو میگوید: «الگوریتم جدید ما که از یادگیری تقویتی نشأت گرفته، امروز فعال است و به بالنهای ما کمک میکند در بالای کِنیا به پرواز دربیایند.»
آلفابت سالها است که خود را به استفاده از فناوری برای اهدافی مثبت متعهد میداند. هرچه تعداد افرادی که لون به آنها اینترنت ارائه میدهد افزایش یابد، آلفابت بیشتر و بیشتر به اهدافش دست پیدا میکند. برای دستیابی به این هدف، استفاده از فناوریهای بهروز و پیشرفته ضروری به نظر میرسد و ظاهرا لون در همین راستا قدم برمیدارد.
نظرات