شوک به انویدیا؛ تراشه هوش مصنوعی AMD MI300 با ۱۵۳ میلیارد ترانزیستور رونمایی شد
AMD در جریان رویداد Advancing AI، از تراشهی هوش مصنوعی جدیدش تحت عنوان MI300X رونمایی کرد. تراشهای که براساس طراحی چیپلتمحور AMD توسعه یافته و هدفش رقابت با تراشهی هوش مصنوعی انویدیا، یعنی H100 است.
تیم قرمز نتایج بنچمارکهای رسمی از این تراشه را به نمایش گذاشت، نتایجی که اگر واقعی باشند تهدیدی جدی برای تراشههای هوش مصنوعی تیم سبز خواهد بود.
براساس بیانیهی مطبوعاتی AMD پردازندهی MI300X آزمون LLM Kernel را تا ۲۰ درصد سریعتر از رقیبش انجام میدهد. در مقایسهی پلتفرممحور، سیستمی که به ۸ تراشهی MI300X مجهز باشد، درمقایسه با سیستم مجهزبه ۸ تراشهی H100 تا ۴۰ درصد در Llama 2 و ۶۰ درصد در Bloom قویتر عمل میکند.
AMD اشاره می کند که در عملکرد یادگیری، MI300X با رقیبش (H100) برابری میکند و در پردازشهای استنتاجی عملکرد بهتری را به نسبت قیمتش ارائه میدهد.
نیروی محرکهی MI300، نرمافزار ROCm 6.0 است. این بستهی نرمافزاری به آخرین نسخه بهروز شده است و اکنون از پردازشهای پیشرفتهی هوش مصنوعی مولد و مدلهای زبانی بزرگ پشتیبانی میکند.
بستهی نرمافزاری جدید از آخرین فرمتهای محاسباتی مانند FP16 و Bf16 و FP8 پشتیبانی میکند؛ همچنین بهینهسازیهایی برای ارائهی سرعت ۲٫۶ برابری در vLLM از طریق کتابخانهی دادههای استنتاجی بهینهشده، سرعت ۱٫۴ برابری در HIP Graph از طریق زمان اجرای بهینه شده، و سرعت ۱٫۳ برابر الگوریتم Flash Attention از طریق کرنلهای بهینه شده ارائه میدهد.
انتظار میرود ROCm 6 اواخر ماه جاری میلادی در کنار شتاب دهندههای هوش مصنوعی MI300 عرضه شود. جالب خواهد بود که ببینیم ROCm 6 چگونه با آخرین نسخه از بستهی NVIDIA CUDA که رقیب واقعی آن است، مقایسه میشود.
MI300X تراشهای است که بیش از همه جلب توجه خواهد کرد؛ زیرا در بخش هوش مصنوعی، شتاب دهندههای Hopper از انویدیا و Gaudi از اینتل را هدف قرار داده است. این تراشه براساس معماری CDNA 3 طراحی شده است و میزبان ترکیبی از IP-های ۵ نانومتری و ۶ نانومتری خواهد بود که همگی با هم ترکیب میشوند تا ۱۵۳ میلیارد ترانزیستور را ارائه دهند.
حافظه یکی دیگر از بخشهایی است که در آن شاهد ارتقای بزرگی هستیم و MI300X نسبت به نسل قبلی خود یعنی MI250X (۱۲۸ گیگابایت)، ۵۰ درصد ظرفیت HBM3 بیشتری دارد. AMD برای دستیابی به حافظهی ۱۹۲ گیگابایتی، MI300X را به ۸ بستهی HBM3 مجهز کرده است.
این حافظه تا ۵٫۳ ترابایتبرثانیه پهنای باند و ۸۹۶ گیگابایتبرثانیه پهنای باند Infinity Fabric را ارائه خواهد کرد. برای مقایسه، شتابدهندهی هوش مصنوعی H200 انویدیا ظرفیت ۱۴۱ گیگابایتی را ارائه میدهد در حالی که Gaudi 3 از اینتل ظرفیت ۱۴۴ گیگابایتی دارد.
از نظر توان مصرفی، MI300X حدودا ۷۵۰ وات برق مصرف میکند که نسبت به ۵۰۰ وات Instinct MI250X افزایش ۵۰ درصدی و نسبت به انویدیا H200 افزایش ۵۰ درصدی را نشان میدهد.
در حال حاضر، پردازنده AMD با رقبای سرسختی در بازار روبهرو است. انویدیا درحال آماده شدن برای عرضهی تراشههای هوش مصنوعی H200 از سری Hopper و B100 از سری بلکول است. اینتل نیز GPU-های Gaudi 3 و Falcon Shores را برای عرضه در سالهای آینده آماده میکند.
شرکتهایی مانند اوراکل، دل، متا و OpenAI پشتیبانی از تراشههای هوش مصنوعی AMD Instinct MI300 را در اکوسیستم خود اعلام کردهاند.