تسلا دوجو؛ ابرکامپیوتر هوش مصنوعی ایلان ماسک
شنبه ۲۴ شهریور ۱۴۰۳ - ۱۳:۳۰مطالعه 12 دقیقهایلان ماسک سالها است در مورد «دوجو» صحبت میکند؛ ابرکامپیوتر هوش مصنوعی که قرار است ستون فقرات بلندپروازیهای هوش مصنوعی تسلا باشد. این پروژه اهمیت بسیار زیادی برای ماسک دارد؛ بهطوری که بهتازگی اعلام کرد تیم هوش مصنوعی شرکت برای دوبرابر کردن تلاشهای خود برای توسعهی دوجو آماده میشود. این اتفاق در حالی میافتد که تسلا قصد دارد روبوتاکسی خود را در ماه اکتبر رونمایی کند؛ اما دوجو دقیقاً چیست و چرا تا این اندازه برای استراتژی بلندمدت تسلا حیاتی است؟
دوجو (Dojo) نام ابرکامپیوتر اختصاصی تسلا است که برای آموزش شبکههای عصبی کاملا خودران (Full Self-Driving؛ بهاختصار FSD) این شرکت طراحی شده است. توسعهی دوجو با هدف تسلا برای دستیابی به سیستم کاملا خودران و عرضهی روبوتاکسی به بازار، هممسیر است. درحالحاضر ، سیستم FSD که تقریباً در دو میلیون از خودروهای تسلا وجود دارد، میتواند برخی از وظایف رانندگی خودکار را انجام دهد؛ اما هنوز هم به حضور و کنترل انسان در پشت فرمان نیاز دارد و کاملاً خودران نیست.
تسلا، رونمایی از روبوتاکسی خود را که برای ماه آگوست برنامهریزی شده بود، به اکتبر موکول کرد؛ اما براساس اظهارات ماسک و برخی از منابع داخلی تسلا، هدف این شرکت برای رسیدن به خوداتکایی همچنان پابرجا است و بهنظر میرسد که برای رسیدن به این هدف، هزینههای هنگفتی را برای توسعهی هوش مصنوعی و دوجو در نظر دارد.
پیشینه تسلا دوجو
ایلان ماسک نمیخواهد تسلا صرفاً یک خودروساز یا حتی ارائهدهندهی پنلهای خورشیدی و سیستمهای ذخیرهی انرژی باشد. او میخواهد تسلا یک شرکت هوش مصنوعی باشد که رمزگشایی از خودروهای خودران را با تقلید از درک انسان انجام داده است.
بیشتر شرکتهایی که در حال ساخت فناوری خودروهای خودران هستند، برای درک جهان به ترکیبی از سنسورها مانند لیزر، رادار، دوربین و نقشههایی با وضوح بالا اتکا دارند. در چنین شرایطی تسلا معتقد است که میتواند با تکیه بر دوربینها برای ثبت دادههای بصری و سپس استفاده از شبکههای عصبی پیشرفته برای پردازش این دادهها و تصمیمگیری سریع در مورد نحوهی رفتار خودرو، به سیستم کاملاً خودران دست یابد.
همانطور که آندره کارپاتی (Andrej Karpathy)، رئیس سابق هوش مصنوعی تسلا هم در نخستین روز هوش مصنوعی تسلا در سال ۲۰۲۱ گفت، این شرکت در تلاش است تا یک حیوان مصنوعی را از ابتدا بسازد. ایلان ماسک از سال ۲۰۱۹ بهشوخی در مورد دوجو صحبت میکرد؛ اما تسلا این خبر را بهطور رسمی در روز هوش مصنوعی (۱ اکتبر ۲۰۲۲) اعلام کرد.
درحالحاضر شرکتهایی مانند Waymo (متعلق به آلفابت) خودروهای خودران سطح ۴ را تجاریسازی کردهاند. این خودروها، براساس تعریف انجمن مهندسان خودرو (SAE) میتوانند در شرایط خاص بدون نیاز به دخالت انسان رانندگی کنند.
تسلا هنوز موفق نشده است سیستم خودرانی تولید کند که نیازی به حضور انسان در پشت فرمان نداشته باشد. این شرکت بیشتر بر رویکرد مبتنیبر دوربین تمرکز دارد و از دوربینها برای جمعآوری دادههای بصری و آموزش شبکههای عصبی خود برای رانندگی خودران استفاده میکند.
تاکنون در حدود ۱٫۸ میلیون نفر هزینهی اشتراک قابلتوجهی را برای سیستم رانندگی کاملاً خودران تسلا پرداخت کردهاند؛ هزینهای ۸ هزار دلاری که تا ۱۵ هزار دلار هم میرسد. گفته میشود نرمافزار هوش مصنوعی آموزشدیده با دوجو در نهایت بهصورت بهروزرسانیهای OTA به مشتریان تسلا ارائه خواهد شد.
تسلا هنوز نتوانسته سیستم خودرانی تولید کند که نیازی به حضور انسان در پشت فرمان نداشته باشد
تسلا برای آموزش سیستم خودران خودرو، حجم عظیمی از ویدیوهای ضبطشده حین میلیونها کیلومتر رانندگی را جمعآوری کرده است؛ بهعبارت دیگر، هرچه تسلا بتواند دادههای بیشتری را جمعآوری کند، به تحقق رویای سیستم کاملا خودران خود نزدیکتر خواهد شد. بااینحال تعدادی از کارشناسان صنعت معتقدند که شاید خوراندن حجم وسیعی از داده به مدل و انتظار هوشمندترشدن آن با محدودیتهایی مواجه باشد.
آناند راگوناتان، استاد مهندسی برق و کامپیوتر دانشگاه پردو در سیلیکون ولی در گفتوگوی خود با تککرانچ گفت: «قبل از هرچیزی باید بدانیم که تلاش برای رسیدن به سیستم کاملا خودران با محدودیتهای اقتصادی مواجه است و بهزودی اجرای آن بسیار هزینهبر خواهد شد. از سوی دیگر برخی ادعا میکنند که شاید در نهایت دادههای ارزشمند موجود برای آموزش مدلها تمام شود. دادههای بیشتر لزوماً بهمعنای اطلاعات بیشتر نیست؛ بنابراین ارزشمندبودن دادههای جمعآوریشده به این بستگی دارد که آیا دادهها، اطلاعات مفیدی برای ایجاد یک مدل بهتر دارند و آیا فرایند آموزش میتواند این اطلاعات را به یک مدل بهتر تبدیل کند یا خیر؟»
بهگفتهی راگوناتان، با وجود تردیدهای متعدد، روند استفاده از دادههای بیشتر حداقل در کوتاهمدت ادامه خواهد داشت. او عقیده دارد که دادههای بیشتر بهمعنای نیاز به قدرت محاسباتی بیشتر برای ذخیره و پردازش همهی آنها بهمنظور آموزش مدلهای هوش مصنوعی تسلا است و دقیقاً همینجا است که ابرکامپیوتر دوجو وارد میدان میشود.
ابرکامپیوتر چیست؟
سیستم ابرکامپیوتر تسلا، دوجو نام دارد که با هدف ارائهی عملکردی شبیه به زمین تمرین برای هوش مصنوعی و بهویژه FSD طراحی شده است. کلمهی ژاپنی Dojo اشاره به مکانی دارد که هنرهای رزمی مانند جودو و کاراته در آن تمرین میشود.
ابرکامپیوتر، از هزاران کامپیوتر کوچکتر بهنام گره تشکیل شده است که هریک از این گرهها، CPU و GPU مخصوص به خود را دارند. CPU مدیریت کلی گره را انجام میدهد و GPU وظیفهی انجام کارهای پیچیدهتر مانند تقسیم وظایف به چندین بخش و اجرای همزمان آنها را برعهده دارد. پردازندههای گرافیکی برای عملیات یادگیری ماشین ازجمله شبیهسازی برای آموزش FSD ضروری هستند.
GPUها همچنین برای آموزش مدل های زبانی بزرگ حیاتی هستند و به همین دلیل هم ظهور هوش مصنوعی مولد، انویدیا را به ارزشمندترین شرکت روی کرهی زمین تبدیل کرده است؛ طوری که حتی تسلا هم برای آموزش هوش مصنوعی خود از GPUهای انویدیا استفاده میکند.
چرا تسلا به ابرکامپیوتر نیاز دارد؟
رویکرد صرفا مبتنیبر بینایی ماشین تسلا، دلیل اصلی نیاز این شرکت به ابرکامپیوتر است. شبکههای عصبی FSD، با مقادیر زیادی از دادههای رانندگی آموزش داده میشوند تا پس از تشخیص و طبقهبندی اشیای اطراف خودرو، تصمیمات لازم را برای راندن خودرو بگیرند. بهعبارت دیگر، وقتی FSD فعال است، شبکههای عصبی باید بهطور مداوم دادههای بصری را که از دوربینهای خودرو دریافت میکنند، با سرعتی در حد قابلیتهای تشخیص عمق و سرعت انسان جمعآوری و پردازش کند.
تسلا میخواهد نسخهی دیجیتال از قشر بینایی و عملکرد مغز انسان ایجاد کند
به عبارت بهتر میتوان گفت که تسلا قصد دارد یک نسخهی دیجیتال از قشر بینایی و عملکرد مغز انسان بسازد. این شرکت برای آموزش مدل خود باید پس از جمعآوری و پردازش ویدیوهای جمعآوریشده از خودروهایش در سراسر جهان، میلیونها عملیات شبیهسازی روی این دادهها انجام دهد.
بهنظر میرسد فعلا تسلا برای تأمین قدرت محاسباتی کامپیوتر آموزشی Dojo به انویدیا وابسته است، اما نمیخواهد به قول انگلیسیها، تمام تخممرغهایش را در یک سبد بگذارد؛ و نه فقط به این دلیل که تراشههای انویدیا گران هستند.
تسلا امیدوار است محصول بهتری از تراشههای انویدیا بسازد که هم پهنای باند بیشتری داشته باشد و هم تاخیر کمتر. به همین دلیل واحد هوش مصنوعی تسلا تصمیم گرفت تا برنامهی سختافزاری سفارشی خود را ارائه دهد که هدف آن آموزش مدلهای هوش مصنوعی بهطور کارآمدتر از سیستمهای سنتی است. در هستهی این برنامه، تراشههای اختصاصی D1 تسلا قرار دارند که بهگفتهی شرکت برای کارهای هوش مصنوعی بهینهسازی شدهاند.
نگاه دقیقتر به تراشههای اختصاصی D1
تسلا هم مانند اپل اعتقاد دارد که سختافزار و نرمافزار باید برای کار با هم طراحی شوند و به همین دلیل در حال تلاش برای دورشدن از سختافزار استاندارد GPU و طراحی تراشههای خود برای توسعهی دوجو است.
تسلا در روز هوش مصنوعی در سال ۲۰۲۱، از تراشهی D1 خود که یک مربع سیلیکونی به اندازهی یک کف دست است، رونمایی کرد. تراشهی D1 که از ماه می امسال وارد مرحلهی تولید شده است توسط غول تراشهسازی تایوانی TSMC و با استفاده از لیتوگرافی ۷ نانومتری تولید میشود. بهگفتهی تسلا، این تراشه ۵۰ میلیارد ترانزیستور دارد و ابعاد دای آن ۶۴۵ میلیمتر مربع است. به عبارت دیگر، D1 قرار است بسیار قدرتمند و کارآمد باشد و بتواند وظایف پیچیده را بهسرعت انجام دهد.
تصاویری از تسلا دوجو که ایلان ماسک ۳ مرداد در ایکس منتشر کرد
با وجود قابلیتهای چشمگیر D1، این تراشه هنوز هم بهاندازهی تراشهی انویدیا که آن هم توسط TSMC و با استفاده از فرایند ۷ نانومتری ساخته میشود، قدرتمند نیست. تراشهی A100 حاوی ۵۴ میلیارد ترانزیستور با ابعاد دای ۸۲۶ میلیمتر مربع است و به همین دلیل کمی بهتر از D1 تسلا عمل میکند.
تیم هوش مصنوعی تسلا، برای دستیابی به پهنای باند و قدرت محاسباتی بالاتر، ۲۵ تراشهی D1 را با هم ترکیب کرد تا بهعنوان یک سیستم کامپیوتری واحد عمل کند. هر تایل از قدرت محاسباتی ۹ پتافلاپس و پهنای باند ۳۶ ترابایتبرثانیه بهره میبرد و تمام سختافزار لازم برای انتقال برق، خنکسازی و ارسال داده را در خود جای داده است.
میتوان تایل (Tile) را بهعنوان یک کامپیوتر خودکفای متشکل از ۲۵ کامپیوتر کوچک تصور کرد که ۶ عدد از آنها یک رک (Rack) را تشکیل میدهند. دو رک یک کابینت را میسازند و ده کابینت یک اگزاپاد (ExaPOD) را تشکیل میدهند. تسلا هنگام معرفی رسمی دوجو اعلام کرد که این ابرکامپیوتر با استقرار چندین ExaPOD، بزرگتر و قدرتمندتر خواهد شد. تمام این قطعات کنار هم یک ابرکامپیوتر را تشکیل میدهند.
تسلا همزمان در حال کار روی تراشه نسل بعدی D2 است که با هدف برطرفکردن گلوگاههای انتقال اطلاعات عرضه میشود. تراشهی D2 بهجای اتصال تراشههای منفرد، کل تایل دوجو را روی یک ویفر سیلیکونی قرار میدهد. تسلا هنوز تعداد تراشههای D1 سفارش دادهشده یا تعدادی که انتظار دریافت آنها را دارد، تأیید نکرده؛ از سوی دیگر این شرکت بازهی زمانی لازم برای راهاندازی ابرکامپیوترهای دوجو مجهزبه تراشههای D1 را هم اعلام نکرده است.
در ماه ژوئن گذشته، پستی در شبکهی اجتماعی X و با این مضمون منتشر شد: «ایلان در حال ساخت یک خنککنندهی GPU غولپیکر در تگزاس است.» ماسک در پاسخ به این پست اعلام کرد که هدف تسلا این است که حدوداً طی ۱۸ ماه آینده، نیمی از سختافزار هوش مصنوعی تسلا و نیمی از انویدیا و یک گزینهی دیگر را در اختیار داشته باشد. براساس اظهارات ماسک در ماه ژانویه، این احتمال وجود دارد که منظور او از گزینهی دیگر، تراشههای AMD باشد.
دوجو برای تسلا چه معنایی دارد؟
کنترل تولید تراشهها برای تسلا به این معنی است که این شرکت احتمالاً روزی بتواند بهسرعت و با هزینهی پایین مقادیر زیادی قدرت محاسباتی را به برنامههای آموزشی هوش مصنوعی خود اضافه کند؛ بهویژه با افزایش تولید تراشه توسط تسلا و TSMC. از سوی دیگر کنترل تولید تراشه یعنی تسلا ممکن است در آینده به تراشههای انویدیا که علاوهبر دسترسی دشوار، بهطور فزایندهای پرهزینه هستند، نیازی نداشته باشد.
تسلا احتمالا در آینده به GPUهای انویدیا نیازی نداشته باشد
بهگفتهی ماسک در گزارش درآمدهای سهماههی دوم تسلا، تقاضا برای سختافزار انویدیا بهقدری زیاد است که بیشتر اوقات دسترسی به GPUها دشوار میشود. او در ادامه با اظهار نگرانی در مورد دسترسی به GPU در مواقع ضروری، تأکید کرد که تسلا باید برای مقابله با این نگرانی تلاش بیشتری برای دوجو انجام دهد تا مطمئن شود که قدرت آموزشی مورد نیاز خود را در اختیار دارد.
درحالحاضر تسلا هنوز هم برای آموزش هوش مصنوعی خود، از تراشههای انویدیا استفاده میکند. ایلان ماسک ماه ژوئن گذشته در پستی در شبکهی اجتماعی X نوشت: «از حدود ۱۰ میلیارد دلار هزینههای مرتبط با هوش مصنوعی تسلا، حدود نیمی از آن داخلی است و عمدتاً به کامپیوتر استنتاجی هوش مصنوعی تسلا، حسگرهای موجود در تمام خودروهای شرکت و دوجو مربوط میشود. سختافزار انویدیا حدود دوسوم هزینههای لازم برای ساخت ابرخوشههای آموزشی هوش مصنوعی را تشکیل میدهد. براساس تخمینهای من، تسلا در سال جاری حدود ۳ تا ۴ میلیارد دلار از انویدیا خرید خواهد کرد.»
رایانش استنتاجی (Inference compute)، به محاسبات هوش مصنوعی که توسط خودروهای تسلا در زمان واقعی انجام میشود، اشاره دارد و جدا از محاسباتی است که دوجو برعهده دارد.
دوجو پروژهی پرریسکی برای تسلا است؛ پروژهای که خود تسلا بارها به احتمال شکستش اذعان کرده است.
روی کاغذ، تسلا در درازمدت میتواند واحد هوش مصنوعی خود را به یک مدل کسبوکار جدید تبدیل کند. بهگفتهی ماسک اولین نسخهی Dojo برای برچسبگذاری و آموزش بینایی کامپیوتری تسلا طراحی خواهد شد که برای FSD و آموزش Optimus (ربات انساننمای تسلا) عالی است؛ اما در زمینههای دیگر کارایی نخواهد داشت.
بنابر گفتههای ماسک، نسخههای آیندهی Dojo بیشتر برای آموزش هوش مصنوعی عمومی طراحی خواهند شد. یکی از مشکلات بالقوه این است که تقریباً تمام نرمافزارهای هوش مصنوعی موجود برای کار با پردازندههای گرافیکی نوشته شدهاند و استفاده از دوجو برای آموزش مدلهای هوش مصنوعی عمومی به بازنویسی نرمافزار نیاز دارد؛ مگر اینکه تسلا هم قدرت محساباتی خود را مانند سرویسهای AWS و Azure که کار محاسبات ابری را انجام میدهند، اجاره دهد.
ماسک در گزارش درآمدهای سهماههی دوم تسلا به این موضوع اشاره کرد که بهنظر او راهی برای رقابت دوجو با انویدیا وجود دارد. شرکت خدمات مالی آمریکایی، مورگان استنلی، در گزارش ماه سپتامبر ۲۰۲۳ خود پیشبینی کرد که دوجو میتواند با بازکردن جریانهای درآمد جدید در قالب تاکسیهای رباتیک و خدمات نرمافزاری، ارزش بازار تسلا را ۵۰۰ میلیارد دلار افزایش دهد. بهطور خلاصه میتوان گفت که تراشههای دوجو برای این خودروساز درست مانند بیمهنامه هستند؛ اما بیمهنامهای که ممکن است سودآور هم باشد.
چقدر با دوجو فاصله داریم؟
رويترز در گزارش سال گذشتهی خود اعلام کرد که تسلا تولید دوجو را در جولای ۲۰۲۳ آغاز کرده است؛ اما پست ایلان ماسک در ژوئن ۲۰۲۳ نشان داد که دوجو تا آن زمان بهمدت چند ماه آنلاین بوده و عملیات مختلفی را هم انجام داده است. تسلا تقریباً همان موقع اعلام کرد که انتظار دارد دوجو تا فوریهی ۲۰۲۴ یکی از پنج ابرکامپیوتر قدرتمند جهان باشد؛ دستاوردی که هنوز بهطور عمومی اعلام نشده و ما هم شک داریم که اصلا اتفاق افتاده باشد.
تسلا همچنین اعلام کرده است که انتظار دارد قدرت محاسبات کلی دوجو تا اکتبر ۲۰۲۴ به ۱۰۰ اگزافلاپس برسد. یک اگزافلاپس برابر با یک کوینتیلیون عملیات کامپیوتری در ثانیه است. تسلا برای رسیدن به ۱۰۰ اگزافلاپس و با فرض اینکه یک D1 میتواند به ۳۶۲ ترافلاپس دست یابد، به بیش از ۲۷۶ هزار D1 یا حدود ۳۲۰٬۵۰۰ عدد تراشهی A100 انویدیا نیاز خواهد داشت.
تسلا در ژانویه ۲۰۲۴ متعهد شد که ۵۰۰ میلیون دلار برای ساخت ابرکامپیوتر دوجو در گیگافکتوری خود در بوفالو نیویورک هزینه کند. ایلان ماسک هم در ماه می ۲۰۲۴ به این موضوع اشاره کرد که قسمت پشتی گیگافکتوری آستین تسلا برای یک «خوشه ابرکامپیوتر فوق متراکم و خنکشده با آب» در نظر گرفته شده است.
ایلان ماسک درست پس از گزارش درآمدی سهماههی دوم تسلا، در یکی از پستهای ایکس خود گفت که تیم هوش مصنوعی این خودروساز از کامپیوتر هوش مصنوعی HW4 تسلا که اکنون به AI4 تغییر نام داده است، استفاده میکند. این سختافزار در خودروهای تسلا تعبیه شده و در چرخهی آموزش با GPUهای انویدیا بهکار میرود. ماسک در پست خود به این موضوع هم اشاره کرد که تقریباً ۹۰ هزار عدد از H100های انویدیا به علاوه ۴۰ هزار کامپیوتر AI4 در این سیستم استفاده میشود.
ماسک در بخشی از پست خود در شبکهی اجتماعی ایکس نوشت: «Dojo 1 تا پایان سال تقریباً معادل ۸ هزار H100 خواهد داشت. درست است که این عدد چندان بزرگی نیست؛ اما کوچک هم نیست.»
با تمام این حرفها، بعید است تسلا دوجو بخواهد انقلاب بعدی هوش مصنوعی را رقم بزند؛ بهویژه وقتی به یاد آوریم که ماسک قبلاً وعدههای بزرگی دربارهی پیشرفت سیستم رانندگی کاملاً خودران داده و قرار بود تا پایان سال ۲۰۲۰، یک میلیون روبوتاکسی تسلا در سطح خیابانها تردد کنند.
تسلا با توسعهی تراشههای یادگیری ماشینی و ساخت ابرکامپیوتر Dojo، قطعاً میتواند در هزینههای آموزش سیستمهای هوش مصنوعی FSD صرفهجویی کند. با این صرفهجویی، تسلا میتواند روی بهبود الگوریتمهای سیستم رانندگی خود با استفاده از دادههای واقعی جمعآوریشده از خودروهایش بیشتر تمرکز کند؛ دادههایی که رقبایش از آنها بیبهره هستند. اما اینکه آیا این پیشرفتها به نقطهی عطفی در رانندگی خودران یا بینایی ماشینی خواهد رسید یا خیر، تقریباً غیرقابل پیشبینی بهنظر میرسد.
نظرات