پردازنده مرکزی Nvidia Grace بر پایه ARM معرفی شد؛ ۱۰ برابر قویتر از x86
انویدیا شب گذشته در جریان برگزاری GTC 2021 معماری متکی بر آرم گریس (Nvidia Grace) را برای پردازندههای مرکزی کلاس دیتاسنتر معرفی و ادعا کرد این معماری ۱۰ برابر سرعت بیشتر نسبت به پرسرعتترین سرورهای امروزی در حوزهی هوش مصنوعی و رایانش با قدرت بالا دارد.
پردازندههای مرکزی اختصاصی انویدیا بهزودی در نقش قلب تپندهی دو ابرکامپیوتر هوش مصنوعی ظاهر میشوند و از هستههای نسل بعد Neoverse آرم که جزئیات دقیقشان را فعلا نمیدانیم استفاده میکنند. این تراشهها در ابرکامپیوترهای یادشده در کنار حافظهی رم LPDDR5x قرار میگیرند که ۵۰۰ گیگابایت بر ثانیه توان عملیاتی ارائه میدهد. ابرکامپیوترها از اتصال ۹۰۰ گیگابایت بر ثانیهایِ NVLink به کارت گرافیکی نامشخص بهره میبرند تا قدرت پردازشی زیادی ارائه بدهند.
آنطور که تامز هاردور مینویسد، انویدیا از نقشهی راه جدید خود نیز که پردازندهی مرکزی بعد از معماری گریس (Grace Next) را برای سال ۲۰۲۵ نشان میدهد پردهبرداری کرده است. تیم سبز میگوید معماری گرافیکی «Ampere Next Next» در اواسط سال ۲۰۲۴ از راه خواهد رسید.
معماری گریس انویدیا فعلا مختص پردازندههای مرکزی کلاس دیتاسنتر است
تصاحب آرم توسط انویدیا که هنوز بهطور کامل انجام نشده و منتظر دریافت چراغ سبز از نهادهای بزرگ تنظیم مقررات در سراسر دنیا است، باعث شد بسیاری از تحلیلگران تخمین بزنند که انویدیا سراغ تولید پردازندهی مرکزی متکی بر معماری آرم میرود. جن سون هوانگ، مدیرعامل انویدیا، پیشتر تأیید کرده بود که احتمال تولید پردازندهی مرکزی انویدیا وجود دارد.
اولین نسل معماری پردازشی گریس در قالب پردازندههای مرکزی کلاس دسکتاپ و لپتاپ ارائه نمیشود؛ اما بهوضوح مشخص است تیم سبز اهداف بزرگی برای پردازندههای کلاس دیتاسنتر گریس در سر میپروراند.
انویدیا فعلا تعداد هسته و سرعت کلاک پردازندههای گریس را اعلام نکرده است که البته اتفاق تعجببرانگیزی محسوب نمیشود؛ چون بنا بر اطلاعات رسمی، پردازندههای دیتاسنتر گریس تا اوایل سال ۲۰۲۳ به بازار عرضه نخواهند شد. البته انویدیا مشخصا گفته است پردازندههای یادشده از هستههای نسل بعد Neoverse آرم استفاده میکنند.
با درنظرگرفتن آنچه دربارهی نقشهی راه عمومی فعلی آرم میدانیم، احتمال میدهیم هستهای که انویدیا به آن اشاره میکند، پلتفرم V1 موسوم به Zeus باشد. هستههای Zeus برای دستیابی به بیشترین قدرت پردازشی بهینه شدهاند و به همین دلیل تمام ناحیهی دای (Die) را در بر میگیرند و مصرف انرژی بالایی دارند.
پردازندههای مبتنی بر هستههای Zeus ممکن است در مدلهای هفت و پنج نانومتری تولید شوند و در مقایسه با هستههای فعلی N1 آرم، تا ۵۰ درصد دستورالعمل بر سیکل کلاک (IPC) بیشتر ارائه بدهند. پلتفرم V1 آرم از تمام فناوریهای جدید مثل PCIe 5.0 و DDR5 و حتی HBM2e یا HBM3 به همراه اینترکانکت CCIX 1.1 پشتیبانی میکند. به نظر میرسد انویدیا حداقل فعلا برای متصل کردن پردازندهی مرکزی و پردازندهی گرافیکی خود، به جای CCIX سراغ NVLink اختصاصی میرود.
انویدیا میگوید پردازندهی مرکزی گریس خواهد توانست امتیاز بالای ۳۰۰ در بنچمارک SPECrate_2017_int_base کسب کند و این یعنی قدرت پردازشی زیادی دارد. تیم سبز ادعا میکند با هشت پردازندهی گرافیکی در یک سیستم DGX، سیستم میتواند به امتیاز فوقالعادهی ۲۴۰۰ در بنچمارک SPECrate_2017_int_base دست پیدا کند. نسل فعلی DGX در بهترین حالت امتیاز ۴۵۰ کسب میکند و این یعنی قرار است شاهد تفاوتهای محسوسی باشیم.
AMD EPYC Milan که جدیدترین پردازندههای تیم قرمز برای دیتاسنتر محسوب میشوند و قدرت پردازشی بسیار زیادی دارند، دارای امتیاز SPEC بین ۳۸۲ تا ۴۲۴ هستند و همین موضوع باعث میشود پردازندهی مرکزی گریس بیشتر در نقش رقیبی برای پردازندههای دیتاسنتر نسل قبل ۶۴ هستهای AMD یعنی سری Rome ظاهر شود. به نظر میرسد ادعای انویدیا مبنی بر ۱۰ برابر شدن قدرت پردازشی پلتفرم جدیدش نسبت به سرورهای نسل فعلی، به پردازش گرافیکی مرتبط باشد.
انویدیا میگوید نخستین مدلهای پردازندهی مرکزی گریس در قالب پکیج BGA در دسترس قرار میگیرند و این یعنی برخلاف پردازندههای مرسوم x86، تراشههای سوکتدار نخواهند بود. به نظر میرسد اولین پردازندههای گریس به همراه هشت بسته حافظهی LPDDR5x در دسترس قرار میگیرند. انویدیا میگوید حافظهی LPDDR5x ECC در مقایسه با سابسیستم استاندارد حافظهی DDR4 دو برابر پهنای باند بیشتر و ۱۰ برابر مصرف انرژی کمتر دارد.
نسل بعد NVLink انویدیا که فعلا جزئیات زیادی دربارهی آن نمیدانیم، تراشه را به پردازندهی مرکزی مجاور با نرخ انتقال ۹۰۰ گیگابایت بر ثانیه (۱۴ برابر سریعتر) متصل میکند. بررسیها نشان میدهد سرعت نسل بعد NVLink انویدیا ۳۰ برابر سریعتر از سیستمهای ارتباطی بین پردازندهی مرکزی و پردازندهی گرافیکی سرور در دنیای امروز است. انویدیا همچنین میگوید نسل جدید NVLink میتواند اطلاعات را در بین پردازندههای مرکزی با سرعت دو برابر بیشتر از سیستمهای مرسوم انتقال بدهد.
استفاده از NVLink باعث انسجام حافظهی کش میشود و این یعنی حافظهی سیستم و پردازندهی گرافیکی (LPDDR5x و HBM) در فضای مشترکی قرار میگیرند تا برنامهنویسی سادهتر شود. انسجام کش همچنین باعث کاهش حرکت دادهها در بین پردازندهی مرکزی و پردازندهی گرافیکی میشود و قدرت پردازشی را بالا و مصرف انرژی را پایین میآورد.
این ترکیب باعث میشود انویدیا از لحاظ تئوری بتواند قابلیتی مثل سیستمهایی که دارای پردازندهی مرکزی EPYC و پردازندهی گرافیکی Radeon Instinct هستند ارائه بدهد. اینتل نیز ترکیب مشابهی با پردازندهی مرکزی Sapphire Rapids و پردازندهی گرافیکی Ponte Vecchio در ابرکامپیوتر Aurora دارد. انویدیا میگوید استفاده از پردازندهی مرکزی و پردازندهی گرافیکی اختصاصی در ابرکامپیوتر ۲٫۸ اگزافلاپسی Selene، زمان مورد نیاز برای تعلیم GPT-3 (بزرگترین مدل هوش مصنوعی زبان طبیعی در دنیا) را از ۱۴ روز به دو روز کاهش میدهد.
انویدیا همچنین از نقشهی راهی رونمایی کرد تا روند منظم ارتقاء قطعات خود را در سالهای پیش رو به نمایش بگذارد. انویدیا میگوید در سالهای آینده با نرخی بهنسبت ثابت، مدل جدید پردازندههای گرافیکی، پردازندههای مرکزی (آرم و x86) و واحد پردازش داده (DPU) خود را معرفی میکند.
پردازندههای دیتاسنتر Nvidia Grace تا اوایل سال ۲۰۲۳ به بازار عرضه نمیشوند
طبق گفتهی جن سون هوانگ، انویدیا هر دو سال یک بار هر یک از معماریهای پردازشی خود را پیشرفتهتر میکند؛ با این توضیح که معماری x86 در یک سال پیشرفتهتر میشود و سال بعد نوبت بهبود آرم میرسد؛ انویدیا میگوید احتمالا در بین آنها بهبودهای دیگری هم اعمال میکند و شاید این بهبودها به جای معماری به فناوری پردازشی مربوط باشند.
نکتهی جالب این است که انویدیا برای انتخاب نام پردازندهی مرکزی گریس از نام گریس هاپر (دانشمند معروف حوزهی کامپیوتر) استفاده کرده است. طبق شایعهها، انویدیا از مدتها پیش کار روی پردازندههای گرافیکی هاپر را که متکی بر طراحی چیپلت هستند آغاز کرده. هماهنگی جالبی در نام پردازندههای مرکزی و گرافیکی جدید تیم سبز به چشم میخورد.
انویدیا میگوید آزمایشگاه ملی لس آلاموس که متعلق به وزارت انرژی ایالات متحده است، بهزودی ابرکامپیوتری با پردازندهی گریس تولید میکند. این سیستم توسط HPE ساخته میشود و در سال ۲۰۲۳ به مرحلهی عملیاتی میرسد. وزارت انرژی آمریکا فعلا جزئیات زیادی دربارهی ابرکامپیوتر جدیدش منتشر نکرده است.
انویدیا میگوید پردازندهی مرکزی گریس در قویترین ابرکامپیوتر هوش مصنوعی دنیا با نام Alps قرار میگیرد؛ سیستم Alps در مرکز ملی رایانش سوئیس واقع میشود و به دانشمندان و محققان اروپایی کمک میکند. ابرکامپیوتر Alps که در ۲۰۲۳ آنلاین میشود، در حوزههایی مثل آبوهوا، دینامیک مولکولی، دینامیک سیالات محاسباتی و موارد اینچنینی به کار خواهد آمد.