مقایسه عملکرد پردازندههای سرور اینتل و AMD در رایانش ابری
شرکت آمریکایی AMD با ساخت تراشهی EPYC، نبرد بر سر پردازندههای سرور میان دو تراشهساز بزرگ آمریکایی، یعنی اینتل و AMD را شدیدتر کرد. درحالیکه بیشترین تمرکز رسانههای خبری بر تراشههای ساختهشده برای مصارف عام و گیمینگ است، این پردازندههای سرور هستند که درآمدهای هنگفتی برای شرکتهای مادر بهبار میآورند. بهجای اظهارنظر دربارهی سطح عملکرد پردازندههای سرور، با بیان نتایج عملی بنچمارکهایی که روی آنها در مرکز داده آمازون انجام شده، بهتر میتوان واقعیتها را بیان کرد.
مقایسهی سطح عملکرد سرورهای رایانش ابری آمازون (Iaas) با پردازندههای اینتل و AMD
سرویس رایانش ابری آمازون AWS EC2 در نوامبر۲۰۱۸، Instanceهای مبتنیبر پردازندههای EPYC از AMD را معرفی کرد. Instance قسمتی از منابع سرور اعم از پردازنده و حافظه مجازی است که دراختیار هر کلاینت قرار میگیرد. این Instanceها از همان تعداد پردازندهی مجازی و ظرفیت حافظهی مجازی نمونههای اینتل استفاده میکنند. Instanceهای EPYC میتوانند در تمام مدت پردازش از ۲ تا ۹۶ پردازندهی مجازی را بهرهبرداری کنند. بهطور کلی، آمازون خدمات Instanceهای AMD خود را ۱۰ درصد ارزانتر از Instanceهای اینتل دراختیار رایانش ابری قرار میدهد.
در این مطلب، قصد داریم نگاهی به گسترهی وسیع موارد کاربرد زیرساختهای ابری بیندازیم و Instanceهای اشارهشده را جزءبهجزء مقایسه کنیم. بهخاطر داشته باشید هرچند از نوع معماری پردازندههای AMD بهکاررفته در سرورهای آمازون اطمینان داریم، از معماری Instanceهای اینتل اطلاع چندانی نداریم. آمازون در زمینهی معماری تراشههای این Instanceها اطلاعاتی منتشر نکرده؛ اما ازآنجاکه انجام برخی از این آزمایشها مستلزم اجرای کدهای AVX512 است، میتوان تصور کرد این Instanceها از آخرین معماری اینتل برخوردار باشند.
در زیر، فهرست کامل انواع آزمونهای بارکاری (workload) را ارائه میکنیم که در این بررسی، روی Instanceهای اینتل و AMD اعمال شده است:
بارکاری int/FP
بارکاری پهنای باند حافظه
بارکاری web/java
بارکاری database
بارکاری (High-Performance Compute (HPC
بیهیچ توضیح اضافهتری، بیایید نگاهی به نتایج بنچمارکهای انجامشده روی این Instanceها بیندازیم. اولین آزمایش بین Instanceهایی با ۱۶ پردازندهی مجازی بود. این آزمایش در محیط سیستمعامل Linux 7.5 و با بهکارگیری کامپایلر ICC اجرا شده است. Instanceهای اینتل برتری اندکی در بارکاری web/java و برتری کاملی در اجرای وظایف HPC (محاسبات سطح بالا) دارند. با درنظرگرفتن اینکه از پردازندهی EPYC دو واحد 128bit-FMA و پردازندههای Skylake و بالاتر دو واحد 512bit-FMA برخوردار هستند، این برتری اینتل چندان تعجببرانگیز نیست؛ چراکه دست بالا را در انجام وظایف HPC خواهد داشت.
در اینجا، ذکر دو نکته ضروری است: ۱. برخی از این Instanceها، بهویژه در سمت سرور، NUMA-binded به دسترسی غیریکنواخت به حافظه مقید نشدهاند؛ چراکه انجام چنین کاری نیازمند تنظیمات زیادی است؛ ۲. استفاده از کامپایلرهای متفاوت، همچون GCC، ممکن است باعث بهبود نتایج عملکرد پردازنده شود.
این قابلیتها روشهای بهینهسازی گرانقیمتی محسوب میشوند و اگرچه شکاف میان دادههای سمت سرور را کاهش میدهد، همچنان برای غلبه بر پردازندههای اینتل کافی نخواهد بود.
در تصویر زیر، ارقام بهدستآمدهی Instanceهایی با ۹۶ پردازندهی مجازی نشان داده شده که بازهم نسخههای سرور اینتل بر نسخههای سرور AMD برتری دارند. در این آزمایش هم اختلاف در اجرای وظایف HPC همچنان زیاد است؛ اما در بخش آزمایشهای پهنای باند از میزان این اختلاف کاسته میشود.
در آخرین بخش، عملکرد را برحسب بهای پرداختی خدمات سرور با مدل قیمتگذاری رایانش ابری آمازون (در تاریخ ۱۲ژانویه۲۰۱۹) آزمودهایم. نتایج این آزمایش در شکل زیر آورده شده است. بهطور متوسط نسخههای اینتل در اجرای وظایف HPC از ارزش پرداخت بیشتری از ۱.۲۵ تا ۴.۱ برابر بیشتر از نسخههای AMD برخوردار هستند.
آنچه از برآیند این آزمایشها میخواهیم بگوییم، این است که Instanceهای اینتل چه ازنظر ارزش پرداخت و چه ازنظر سطح عملکرد در بین تمام موارد رایانش ابری، در جایگاه بالاتری ایستادهاند.
مجددا یادآوری میکنیم که ممکن است با بهکارگیری کامپایلرهای مختلف و انجام بهینهسازیهایی روی بارکاری تخصیصیافته در محل سرور (مثل Numa-binding) نسخههای AMD به سطح عملکرد بهتری دست پیدا کنند؛ اما این میزان بهبود برای غلبه بر تفاوتهای سختافزاری نهفته در تراشههای اینتل کافی نخواهد بود. برخی از این تفاوتها استفاده از تراشههای یکپارچه در نسخهی اینتل بهجای ماژولهای چندتراشهای در نسخههای AMD و نیز اختلاف در FMAها است که در پردازش HPC بسیار مهم خواهد بود. برمبنای ارقام بهدستآمده، بهنظر میرسد اینتل همچنان بازار مراکز داده را در تصاحب خود داشته باشد. بااینحال در سمت دیگر ماجرا، بازارهای حرفهای و غیرحرفهای ویرایش ویدئو وجود دارد که پردازندههای EPYC با درنظرگرفتن هزینههای ارزانتر خدماتِ سرورهای مجهز به آن، میتواند درخشش بیشتری داشته باشد.