دو ابررایانهی چینی مرز اگزا اسکیل را شکستند
پیش از این دو ابررایانهی چینی رکورد اگزا اسکال را شکستهاند، اما توسعهدهندگان این سیستمها ترجیح دادهاند فعلا در مورد این خبر سکوت کنند. طبق گزارشها، هر دو سیستم به پردازندههای موبی فیتیوم (Phytium) و سانوِی (Sunway) مجهز شدهاند و بنابراین از فناوریهای حیاتی توسعهیافته خارج تیانشیا (Tianxia) استفاده نمیکنند. اگر این گزارشها واقعیت داشته باشند، چین در ابررایانههای اگزا اسکیل، از ایالات متحده جلوتر است، اما یک مشکل در این میان وجود دارد.
تقریبا یک سال جلوتر
بر اساس گزارش نکستپلتفرم (NextPlatfrom)، دو سیستم چینی در ماه مارس ۲۰۲۱، به حداکثر قدرت پردازشی ۱/۴ اگزا فلاپس عملکرد پایدار ۱/۰۵ اگزا فلاپس در معیان لینپنک (Linpacl) دست یافتهاند. بااینحال، هیچ یک از این ابررایانهها تاکنون در فهرست ۵۰۰ ابررایانهی برتر جهان دیده نمیشوند؛ زیرا توسعهدهندگان این سیستمها نمیخواهند مشکلی بین پیمانکاران فرعی شرکای آنها با دولت ایالات متحده بهوجود آید.
به گزارش تامزهاردوِر، نکستپلتفرم این اطلاعات را از یک منبع آمریکایی دریافت کرده است که از خبرهای چین اطلاع دارد. اگر این گزارشها دقیق باشند، چین تقریبا از یک سال قبل، ایالات متحده را در بخش سیستمهای اگزا اسکیل شکست داده است، زیرا ابررایانهی فرانتیر (Frontier) که به Oak Ridge تعلق دارد، کار خود را از اواخر سال ۲۰۲۱ آغاز خواهد کرد.
با اینحال، برخی از عوامل را باید در نظر گرفت. عملکرد هدف ابررایانهی فرانتیر حدود ۱/۵ ترافلاپس است که در مقایسه با قدرت پایدار ابررایانههای اگزا اسکیل چین، تقریبا ۵۰ درصد بهتر است. علاوهبر این، پیشبینی شده که فرانتیر حدود ۳۰ مگاوات برق مصرف خواهد کرد و این درحالی است که یکی از رقبای چینی آن حدود ۳۵ مگاوات برق مصرف میکند. در نهایت، توسعهدهندگان چینی از معماریهای موجود برای سیستمها و بارهای کاری در مقیان پتا فلاپس بهره میبرند که شاید برای آینده بهینه نباشد.
معماری سانوِی
اولین سیستم چینی در مقیاس اگزا، در مرکز ملی ابررایانه در Wuxi قرار دارد. این ابرکامپیوتر که «سانوِی اوشنلایت» نام دارد، توسط مرکز تحقیقات ملی مهندسی و فناوری کامپیوتر موازی (NRCPC) طراحی شده است و بر اساس پردازندههای ترکیبیِ اختصاصی سانوی کار میکنند. این پردازندهها چند هستهای بوده و در اوایل سال جاری در ارتباط با ماشینهای اگزا اسکیل مورد توجه قرار گرفتند.
معماری پردازندههای سانوی از سال ۲۰۱۶ یعنی زمانیکه ابررایانهی Sunway TaihuLight با ۴۰۹۶۰ پردازندهی Sunway SW26010 تولید شد، در دسترس قرار گرفته است. پردازندههای Sunway SW26010 از چهار خوشهی ناهمگن (گروههای هستهی CG) بهره میبرند که با استفاده از یک شبکه، روی تراشهای با کارایی بالا به یکدیگر متصل شدهاند. هر CG دارای یک واحد پردازش پروتکل (PPU)، یک عنصر پردازش مدیریت (MPE) با موتور ۲۵۶ بیتی، ۶۴ عنصر پردازش محاسباتی (CPE) با موتور ۲۵۶ بیتی و یک کنترلر حافظهی DDR3 است. هر SW26010 در مجموع به چهار MPE و CPE از نوع ۲۵۶ بیتی مجهز شده و فرکانس کاری آن ۱/۵ گیگاهرتز است.
چین پیشبینی کرده است که با افزایش تعداد هستههای MPE و CPE در هر پردازنده و تغییر معماری آنها (بهعنوان مثال، افزودن پشتیبانی از دستورالعملهای ۵۱۲ بیتی به CPE) میتوان پایهای برای یک ابررایانه با قدرت پردازشی چهار اگزا فلاپس ایجاد کرد.
بر اساس این گزارش، مهندسان NRCPC تعداد هستههای هر پردازنده را دوبرابر کردهاند (یعنی تعداد هستههای هر تراشه به ۵۲۰ عدد رسیده است) تا قدرت عملکرد سوکتها دوبرابر شود و میزان مصرف انرژی پردازندهی مرکزی جدید نیز با بهره گرفتن از فناوری مدرن، کاهش یافته است. این مهندسان سپس تعداد گرهها را دوبرابر کردهاند و یک سیستم اتصال جدید (و احتمالا یک سیستم ذخیرهسازی جدید) معرفی کردهاند تا با استفاده از ۴۲ میلیون هستهی مبتنی بر معماری RISC 64، به قدرت پردازشی ۱/۰۳ اگزا فلاپس دست یابند.
مزیت واضح چنین رویکردی این است که NRCPC یک معماری آشنا را حفظ کرده است که میتواند بار کاری موجود و محاسبات با راندمان بالا (HPC) را که به FP64 یا دقت ترکیبی برای بارهای کاری مرتبط با یادگیری ماشینی/هوش مصنوعی نیاز دارند، پردازش کنند. در همینحال، دوبرابر شدن تعداد هستهها در هر سوکت و همچنین افزایش تعداد سوکتها باعث شده است تا مصرف برق این ابررایانه به ۳۵ مگاوات برسد. این سطح مصرف انرژی، فوقالعاده نیست، اما نشان میدهد که مصرف انرژی ابررایانهی اوشنلایت نسبت به ابررایانهی فرانتیر ORNL بهینهتر است.
معماری فیتیوم
دومین ابررایانهی اگزا اسکیل چین، ماشین Tianhe-3 است که در مرکز ملی ابررایانه در گوانگژو چین قرار دارد. این سیستم از پردازندههای فیتیوم ۲۰۰۰ پلاس (FTP) بهره میبرد که معماری آنها بر اساس فناوری Armv8 است. این معماری بیشتر برای بارهای کاری سنتی HPC با دقت کامل FP64 و شتابدهندههای DSP ماتریکس ۲۰۰۰ پلاس (MTP) طراحی شده است. هنوز هیچ اطلاعاتی در مورد عملکرد پایدار Tianhe-3 در دسترس نیست، اما قدرت عملکرد آن در بهترین حالت به ۱/۳ اگزا فلاپس میرسد. علاوهبر این، میزان مصرف برق این ابررایانه مشخص نشده است.
Tianhe-3 از نظر معماری شبیه به Tianhe-2A است. Tianhe-2A در سال ۲۰۱۵ معرفی شد. این ابررایانه از پردازندههای FT-2000 فیتیوم و شتابدهندههای DSP ماتریکس ۲۰۰۰ بهره میبرد. توسعهدهندگان برای دستیابی به قدرت پردازشی بیشتر از یک اگزا فلاپس، مجبور شدهاند تعداد پردازندهها و شتابدهندههای Tianhe-3 را افزایش دهند. این احتمال وجود دارد که ابررایانهی مورد بحث، به یک پردازندهی جدید که با هستهها و عناصر پردازشی بیشتر و فرایند جدیدتری تولید شده، مجهز شده باشد. البته نمیتوان بدون در دسترس داشتن جزئیات در مورد Tianhe-3 توضیح داد که این سیستم چگونه به کلاس اگزا اسکیل رسیده است، اما میتوان گفت معماری فیتیوم از سال ۲۰۱۵ بهبعد بهاندازهی کافی مقیاسپذیر بوده است.
رقابت
دانشمندان مرکز ملی ابررایانه در وکسی و مرکز ملی ابرکامپیوتر از گوانژو تصمیم گرفتند برای توسعهی دو نمونه از اولین ابررایانههای بزرگ اگزا اسکیل جهان، از روشی ایمن بهره بگیرند و از معماریهای موجود استفاده کنند. در نتیجه، توسعهدهندگان Sunway Microelectronics (یا Shenwei Microelectronics) و Tianjin Phytium Information Technology با موفقیت تراشههای مناسبی طراحی کرده و با استفاده از گرههای فعلی آنها را تولید کردهاند.
مشخص نیست برای ساخت تراشههای جدید از کدام فناوریهای فرآیندی، استفاده شده است، اگرچه میتوانی پیشبینی کرد این پردازندهها با فرآیندهای کلاس ۱۴ نانومتری/۱۶ نانومتری، که بازدهی آنها قبلا اثبات شده است و تحت نظارت دقیق دولت ایالات متحده نیستند، توسعه داده شده باشند. همچنین مشخص نیست که سازندهی این تراشهها، شرکت چینی SMIC بوده یا شرکت تایوانی TSMC این وظیفه را به عهده داشته است. هر دو شرکت مزایای خاص خود را دارند: SMIC به هیچوجه توسط مقامات ایالات متحده قابل کنترل نیست، درحالیکه TSMC کتابخانههای HPC گرا را برای گره N16 خود ثابت کرده است.
ممکن است ابرکامپیوترهای اگزا اسکیل چین در مصرف انرژی خیلی بهینه عمل نکنند، اما اگر این سیستمها برای توسعهی سلاحهای جدید استفاده شوند، مصرف انرژی آخرین نگرانی اپراتورهای آنها خواهد بود. همچنین این احتمال وجود دارد که ابررایانههای مورد اشاره بهطور مؤثر به قدرت پردازشی دو و چهار اگزا فلاپس دست نیافته باشند، اما باز هم توان پردازشی زیادی ارائه میدهند. علاوهبر این، اگر تولید ابررایانههای چینی، بومی سازی شود، این کشور میتواند ابررایانههای اگزا اسکیل بیشتری بسازد و در نتیجه رقابت بیشتری در حوزههای مختلف ایجاد کند.
شرکت Tianjin Phytium و Sunway Microelectronics (یا Shenwei Microelectronics) در فهرست نهادهای وزارت بازرگانی ایالات متحده قرار دارند و بههمین دلیل، توسعهی تراشههای پیشرفتهی مبتنی بر معماریهای جدید، برای ابررایانههای اگزا اسکیل آیندهی چین، سختتر خواهد شد. این درحالی است که شاید چین اولین کشوری باشد که به قدرت پردازشی یک اگزا فلاپس دست یافته، و ممکن است این جایگاه را برای مدتی حفظ کند.
۱/۰۴ اگزا فلاپس، قدرت محاسباتی بسیار زیادی محسوب میشود، اما رقابت در حوزهی ابررایانهها درحال افزایش است و زمان نشان خواهد داد که شرکتهایی مثل اینتل، AMD و انویدیا، فناوریهای جدید را با چه سرعتی توسعه خواهند داد تا توان پردازشی چهار یا حتی ۱۰ اگزا فلاپس در ابررایانههای آمریکایی و اروپایی ارائه شود. در هرحال، قدرت ابررایانههای چین حداقل تا چند سال آینده همچنان بهعنوان بیشترین توان پردازشی ارائه شده در این حوزه، باقی خواهد ماند.
نظر شما در مورد ابررایانههای جدید چین چیست؟ آیا این کشور میتواند جایگاه فعلی را بهمدت طولانی حفظ کند؟
نظرات