آیا اپل با M1 Ultra میتواند با بهترینهای اینتل و انویدیا رقابت کند؟
اپل در رویداد Peek Performance، قدرتمندترین عضو خانوادهی اپل سیلیکون را معرفی کرد. M1 Ultra بهنوعی ترکیبی از دو تراشهی M1 Max بهحساب میآید و از CPU بیست هستهای و گرافیک ۶۴ هستهای بهره میبرد. تراشهی جدید اپل به کامپیوتر رومیزی و کوچک مک استودیو قدرت میبخشد و قرار است تا بهترینهای دنیای PC را به چالش بکشد.
تراشهی M1 Ultra درواقع ترکیبی از دو تراشهی M1 Max بهحساب میآید. مهندسان کوپرتینو دو تراشهی M1 Max را با رابطی موسوم به UltraFusion به یکدیگر متصل کردهاند. این رابط با پهنای باند فوقالعاده پرسرعت ۲٫۵ ترابایتبرثانیهای به دو بلوک M1 Max اجازه میدهد تا مانند یک تراشهی واحد رفتار کنند. تراشهی جدید اپل با لیتوگرافی ۵ نانومتری TSMC تولید میشود و ۱۱۴ میلیارد ترانزیستور در دل خود دارد.
اپل میگوید تراشهی جدیدش میتواند عملکردی همسطح Core i9-12900K و RTX 3090 را با توان مصرفی بهمراتب کمتر، ارائه دهد؛ اما این ادعا چه اندازه با واقعیت همخوانی دارد؟ در ادامه براساس بنچمارکهای M1 Max، عملکرد M1 Ultra را تخمین میزنیم.
ویدئوی تحلیل تراشه M1 Ultra
پردازنده مرکزی M1 Ultra دربرابر Core i9 12900K
M1 Ultra از ترکیب ۱۶ هستهی پرقدرت با واحدهای اجرایی فوقعریض و ۴ هستهی کممصرف با واحدهای اجرایی عریض بهعنوان CPU استفاده میکند. اپل در مورد فرکانس و معماری هستهها اطلاعات چندانی ارائه نمیدهد؛ اما بهنظر نمیرسد تغییری در این زمینه شاهد باشیم؛ احتمالاً هستههای پرقدرت و کممصرف از همان معماری M1 بهره میبرند و فرکانس آنها بهترتیب ۳٫۲ و ۲٫۰ گیگاهرتز است.
هرکدام از هستههای پرقدرت M1 Ultra به ۳۲۰ کیلوبایت کش L1 دسترسی دارند؛ در حالیکه در مجموع ۴۸ مگابایت کش L2 بهصورت مشترک در اختیارشان قرار گرفته است. اعداد یادشده برای هستههای کممصرف بهترتیب ۱۹۲ کیلوبایت و ۸ مگابایت هستند. بهلطف ترکیب دو بلوک M1 Max، اکنون ۶۴ مگابایت کش سیستمی نیز برای کل سیستم دردسترس قرار دارد؛ اما از کش سطح L3 خبری نیست.
در سوی دیگر میدان، پردازندهی Core i9-12900K از ترکیب ۸ هستهی پرقدرت با معماری Golden Cove، فرکانس پایهی ۳٫۲ و فرکانس توربوی ۵٫۲ گیگاهرتز در کنار ۸ هستهی کممصرف با معماری Gracemont، فرکانس پایهی ۲٫۴ و فرکانس توربوی ۳٫۹ گیگاهرتز بهره میبرد. هستههای پرقدرت از پردازش چندرشتهای پشتیبانی میکنند؛ بنابراین کل پردازنده قابلیت پردازش همزمان ۲۴ رشته را دارد.
مشخصات فنی پردازندهی مرکزی M1 Ultra دربرابر Core i9-12900K | ||
---|---|---|
پارامترها/تراشه | Apple M1 Ultra | Intel Core i9-12900K |
فرایند ساخت | ۵ نانومتری TSMC تراکم تقریباً ۱۷۱٫۳۰ میلیون ترانزیستور بر میلیمترمربع | Intel 7 تراکم تقریباً ۱۰۰٫۷ میلیون ترانزیستور بر میلیمترمربع |
هستهها | ۱۶ هستهی پرقدرت با فرکانس ۳٫۲ گیگاهرتز ۴ هستهی کممصرف با فرکانس ۲٫۰ گیگاهرتز | ۸ هستهی پرقدرت با فرکانس پایه و توربوی ۳٫۲ و ۵٫۲ گیگاهرتز ۸ هستهی کممصرف با فرکانس پایه و توربوی ۲٫۴ و ۳٫۹ گیگاهرتز |
کش L1 | ۳۲۰ کیلوبایت برای هریک از هستههای پرقدرت ۱۹۲ کیلوبایت برای هریک از هستههای کممصرف | ۸۰ کیلوبایت برای هریک از هستههای پرقدرت ۹۶ کیلوبایت برای هریک از هستههای کممصرف |
کش L2 | ۴۸ مگابایت برای کل هستههای پرقدرت ۸ مگابایت برای کل هستههای کممصرف | ۱٫۲۵ مگابایت برای هریک از هستههای پرقدرت ۴ مگابایت برای کل هستههای کممصرف |
کش L3 | ندارد | ۳ مگابایت برای هریک از هستههای پرقدرت ۶ مگابایت برای کل هستههای کممصرف |
کش اشتراکی سطح سیستم | ۶۴ مگابایت برای کل تراشه | ندارد |
DRAM | ۶۴ یا ۱۲۸ گیگابایت رم 6400-LPDDR5 | تا ۱۲۸ گیگابایت DDR5-4800 یا DDR4-3200 |
پهنای باند حافظه | ۸۰۰ گیگابایتبرثانیه | ۷۶٫۸ گیگابایتبرثانیه |
توان مصرفی | ۶۰ تا ۷۰ وات | ۱۲۵ وات پایه و ۲۴۱ وات توربو |
هرکدام از هستههای پرقدرت Core i9 12900K در مجموع به ۸۰ کیلوبایت کش L1 و ۱٫۲۵ مگابایت کش L2 و ۳ مگابایت کش L3 دسترسی دارند. هریک از هستههای کممصرف ۹۶ کیلوبایت کش L1 دراختیار دارند؛ در حالیکه ۲ بلوک حافظهی ۲ مگابایتی L2 و ۲ بلوک حافظهی ۳ مگابایتی L3 نیز بهصورت مشترک برای هستههای کممصرف تدارک دیده شده است.
تراشهی M1 Ultra از حداکثر ۱۲۸ گیگابایت رم LPDDR5-6400 با پهنای باند شگفتانگیز ۸۰۰ گیگابایتبرثانیه پشتیبانی میکند؛ این مقدار رم در قالب ۸ بلوک ۱۶ گیگابایتی و دستههای چهارتایی در دو طرف تراشه قرار گرفتهاند؛ البته در نظر داشته باشید که M1 Ultra از حافظهی ۱۲۸ گیگابایتی DRAM خود بهعنوان VRAM نیز استفاده میکند.
پردازندهی Core i9 12900K نیز درستمانند M1 Ultra از ۱۲۸ گیگابایت رم پشتیبانی میکند؛ اما در بهترین شرایط میتوان از رم DDR5-4800 همراه آن استفاده کرد. حداکثر پهنای باند حافظه دردسترس با پردازندهی بالاردهی اینتل به ۷۶٫۸ گیگابایتبرثانیه میرسد.
توان مصرفی پکیج CPU در تراشهی M1 Max به حدود ۳۰ تا ۳۵ وات میرسید؛ بنابراین احتمالاً توان مصرفی پردازندهی مرکزی M1 Ultra در محدودهی ۶۰ تا ۷۰ وات قرار خواهد داشت؛ در حالیکه پردازندهی قدرتمند Core i9 12900K اینتل در بازههای زمانی کوتاه به توان مصرفی توربوی ۲۴۱ وات میرسد و توان مصرفی پایهی آن در محدودهی ۱۲۵ تا ۱۵۰ وات قرار میگیرد.
اپل میگوید پردازندهی مرکزی M1 Ultra با مصرف یکسان حدود ۶۰ وات، تا ۹۰ درصد سریعتر از تراشهی نسل دوازدهمی Core i9-12900K عمل میکند. کوپرتینونشینها به نام بنچمارک اشارهای نمیکنند و صرفاً به عبارت «بنچمارکهای استاندارد رایج» در پانویس صفحات خود بسنده میکنند. در هر صورت براساس بنچمارکهای تراشهی M1 و M1 Max با در نظر گرفتن ضریب افت حدود ۱۰ درصدی بهدلیل استفاده از اینترکانکشن UltraFusion، بهصورت حدودی میتوان عملکرد M1 Ultra را در بنچمارک CineBench R23 تخمین زد.
ازآنجاکه M1 Ultra از همان معماری M1 Max استفاده میکنند؛ بنابراین احتمالاً در بنچمارکهای تکهستهای عملکرد مشابهی را از هر دو تراشه شاهد خواهیم بود. با همین فرض، در بنچمارک CineBench تراشهی غولپیکر اپل به امتیاز ۱۵۵۶ دست مییابد که حدود ۲۰ درصد از امتیاز ۱۹۷۳ پردازندهی Core i9-12900K ضعیفتر است.
در بنچمارک تکهستهای CineBench برتری از آن اینتل است
* توجه داشته باشید که ازآنجاکه متأسفانه هنوز سیستمی با Core i9 12900K را در زومیت بررسی نکردهایم، نمودار زیر با ترکیبی از اعداد بهدستآمده در بررسیهای زومیت و آنانندتک بهدست آمدهاند.
در بنچمارک چندهستهای CineBench R23، پردازندهی مرکزی M1 Ultra به امتیاز تخمینی ۲۲۳۲۳ و Core i9 12900K به امتیاز ۲۶۷۶۶ دست مییابد؛ بنابراین در این آزمون نیز تراشهی اپل با اختلافی ۱۵ درصدی ضعیفتر از پردازندهی اینتل عمل میکند.
M1 Ultra با ۶۰ درصد مصرف کمتر، ۸۵ درصد از عملکرد Core i9-12900K را ارائه میدهد
توجه داشته باشید که پردازندهی Core i9-12900K برای دستیابی به چنین عملکرد خیرهکنندهای به کیسی حجیم با سیستم خنککنندهی کارآمدی نیاز دارد؛ چراکه توان مصرفی آن برای دقایقی در محدودهی ۲۵۰ وات و در حالت پایدار در محدودهی ۱۵۰ وات قرار میگیرد. پردازندهی اینتل این عملکرد خیرهکننده را نمیتواند با توان مصرفی ۶۰ تا ۷۰ وات و کیس کوچک ۳٫۶ لیتری همچون مک استودیو بهدست آورد.
از دلایل ضعف و برتری دو پردازنده نسبت به هم میتوان به لیتوگرافی بهمراتب بهینهتر (۵ نانومتر TSMC دربرابر Intel 7) و معماری قدیمیتر M1 Ultra اشاره کرد که به سال ۲۰۲۰ و تراشهی M1 بازمیگردد.
گرافیک M1 Ultra دربرابر RTX 3090
M1 اولترا از گرافیک یکپارچهی ۴۸ یا ۶۴ هستهای استفاده میکند و براساس اعلام اپل در قدرتمندترین نسخه از ۸۱۹۲ واحد اجرایی با قابلیت پردازش همزمان ۱۹۶٬۶۰۸ رشته، ۲۵۶ واحد مدیریت بافت و ۱۲۸ واحد رندر خروجی بهره میبرد. گرافیک M1 Ultra معماری مشترکی با M1 Max دارد و بهاحتمال زیاد با همان فرکانس ۱۲۹۶ مگاهرتزی کار میکند.
اپل توان محاسباتی M1 Ultra روی اعدادی با ممیز شناور و دقت مضاعف (FP32) را ۲۱ ترافلاپس عنوان میکند و میگوید گرافیک تراشهی قدرتمندش از پسِ رندر بافتها با نرخ ۶۶۰ گیگاتکسلبرثانیه و پیکسلها با نرخ ۳۳۰ پیکسلبرثانیه برمیآید.
مشخصات فنی گرافیک M1 Ultra دربرابر RTX 3090 | ||
---|---|---|
پارامترها/تراشه | Apple M1 Ultra | NVIDIA RTX 3090 |
فرایند ساخت | ۵ نانومتری TSMC تراکم تقریباً ۱۷۱٫۳۰ میلیون ترانزیستور بر میلیمترمربع | ۸ نانومتری سامسونگ تراکم تقریباً ۴۵٫۱ میلیون ترانزیستور بر میلیمترمربع |
واحدهای محاسباتی | ۸۱۹۲ | ۱۰۴۹۶ |
واحدهای مدیریت بافت | ۵۱۲ | ۳۲۸ |
واحدهای رندر خروجی | ۲۵۶ | ۱۱۲ |
فرکانس گرافیک | ۱۲۹۶ مگاهرتز | ۱۳۹۵ مگاهرتز پایه و ۱۶۹۵ مگاهرتز بیشینه |
حافظه | ۶۴ یا ۱۲۸ گیگابایت LPDDR5-6400 | ۲۴ گیگابایت GDDR6X |
پهنای باند حافظه | ۸۰۰ گیگابایتبرثانیه | ۹۳۶٫۲ گیگابایتبرثانیه |
توان محاسباتی FP32 | ۲۱ ترافلاپس | ۳۵٫۶ ترافلاپس |
نرخ پردازش بافت | ۶۶۰ گیگاتکسلبرثانیه | ۵۵۶ گیگاپیکسلبرثانیه |
نرخ پردازش پیکسل | ۳۳۰ گیگاپیکسلبرثانیه | ۱۸۹٫۸ گیگاپیکسلبرثانیه |
توان مصرفی | ۱۰۰ تا ۱۲۰ وات | ۳۵۰ وات |
گرافیک M1 Ultra از حافظهی VRAM مجزا بهره نمیبرد و از همان ماژولهای DRAM از نوع LPDDR5-6400 با پهنای باند ۸۰۰ گیگابایتبرثانیه استفاده میکند؛ بدینترتیب روی کاغذ گرافیک M1 Ultra به ۱۲۸ گیگابایت حافظهی VRAM دسترسی دارد که معادل آن را در هیچ کارت گرافیک تجاری دیگری نمیتوان یافت.
گرافیک پرچمدار انویدیا بالغبر ۱۰۴۹۶ هسته، ۳۲۸ واحد مدیریت بافت و ۱۱۲ واحد رندر خروجی در بطن خود دارد. این گرافیک از معماری Ampere انویدیا بهره میبرد و با فرکانس پایه و بیشینهی ۱۳۹۵ و ۱۶۹۵ مگاهرتز کار میکند. RTX 3090 از ۲۴ گیگابایت حافظهی پرسرعت GDDR6X با پهنای باند ۹۳۶٫۲ گیگابایتبرثانیه بهره میبرد.
انویدیا توان محاسباتی RTX 3090 روی اعدادی با دقت مضاعف (FP32) را ۳۵٫۵۸ ترافلاپس عنوان میکند. بررسیها نشان میدهد که گرافیک غولپیکر انویدیا بافتها و پیکسلها را بهترتیب با نرخ ۵۵۶ گیگاتکسلبرثانیه و ۱۸۹٫۸ گیگاپیکسلبرثانیه پردازش میکند.
براساس دادههای موجود از گرافیک M1 Max، بهنظر میرسد که توان مصرفی گرافیک ۶۴ هستهای M1 Ultra در محدودهی ۱۰۰ تا ۱۲۰ وات قرار میگیرد؛ در حالیکه RTX 3090 برای ارائهی عملکرد خیرهکنندهاش به توانی بالغبر ۳۵۰ وات نیاز دارد.
M1 Ultra در بنچمارک GFXBench با ۲۰۰ وات مصرف کمتر، ۱۰ درصد بهتر از RTX 3090 عمل میکند
اپل میگوید گرافیک M1 Ultra با ۲۰۰ وات مصرف انرژی کمتر، میتواند عملکردی همسطح RTX 3090 دراختیار کاربر بگذارد؛ اما بازهم به نام بنچمارکی که برای رسیدن به این نتیجه استفاده کرده است، اشارهای نمیکند؛ اما براساس تجربهی قبلیمان، بنچمارک بازیمحور GFXBench معمولاً با ادعاهای اپل همخوانی دارد.
در نمودار زیر، با در نظر گرفتن ضریب افت ۱۵ درصدی بهدلیل وجود اینترکانکشن UltraFusion بین دو تراشهی M1 Max و براساس عملکرد M1 Max به امتیاز ۵۲۵ فریمبرثانیه در بنچمارک Aztec Ruins High Tier Offscreen برای M1 Ultra دست یافتیم که ۱۰ درصد بهتر از نتیجهی بهدستآمده برای RTX 3090 در بررسی کیس غولپیکر MSI Aegis Ti5 است.
برتری M1 Ultra در بنچمارک GFXBench را میتوان در اختلاف نرخ پردازش پیکسلها و بافتها جستوجو کرد؛ این پردازشها روی تراشهی اپل با نرخ ۳۳۰ گیگاپیکسلبرثانیه و ۶۶۰ گیگاتکسلبرثانیه صورت میگیرد؛ در حالیکه RTX 3090 چنین پردازشهایی را با نرخ پایینترِ ۱۸۹٫۸ گیگاپیکسلبرثانیه و ۵۵۶ گیگاتکسلبرثانیه صورت میدهد.
در بنچمارکهای محاسباتی، برتری مطلق از آن RTX 3090 است
وقتی صحبت از توان محاسباتی بهمیان میآید، برتری مطلق از آن RTX 3090 است؛ همانطور که در نمودار زیر مشاهده میکنید، با در نظر گرفتن ضریب افت ۱۵ درصدی و براساس عملکرد M1 Max به امتیاز ۱۲۳۶۰۳ برای تراشهی M1 Ultra دست یافتیم که با ختلافی ۴۰ درصدی، در سطح پایینتری نسبت به گرافیک RTX 3090 قرار میگیرد.
ضعف فاحش M1 Max در بنچمارکهای محاسباتی نسبت به RTX 3090 را میتوان به کمبودن تعداد واحدهای اجرایی (۸۱۹۲ دربرابر ۱۰۴۹۶) و توان محاسباتی پایینتر آن (۲۱ دربرابر ۳۵٫۶ ترافلاپس) نسبت داد.
در مورد گرافیک نیز باید به تفاوت توان مصرفی اشاره کرد؛ برای دستیابی به بالاترین سطح عملکرد RTX 3090 به کیسی غولپیکر با سیستم خنککنندهای کارآمد نیاز خواهید داشت. توان مصرفی گرافیک قدرتمند انویدیا حدود ۳ برابر M1 Ultra است.
جمعبندی
M1 Ultra بهمدد مواردی همچون واحدهای اجرایی فوقعریض هستههای Firestorm، حافظههای کش حجیم و پهنای باند فوقالعادهی ۸۰۰ گیگابایتبرثانیهای، عملکرد خیرهکنندهای را بهنسبت توان مصرفی اندکش بهنمایش میگذارد؛ اگر تخمینهایمان را ملاک قرار دهیم، پردازندهی مرکزی M1 Ultra با ۶۰ درصد مصرف انرژی کمتر، میتواند ۸۵ درصد از عملکرد پردازندهی قدرتمند Core i9-12900K را ارائه دهد.
M1 Ultra: عملکرد همسطح PC-های غولپیکر در دل کیس کوچکتر از Mini ITX!
در سوی دیگر میدان، M1 Ultra بهاحتمال زیاد در بنچمارک بازیمحور GFXBench حدود ۱۰ درصد بهتر از RTX 3090 عمل میکند؛ اما در بنچمارکهای محاسباتی با اختلافی ۶۰ درصدی از گرافیک انویدیا جا میماند.
توجه داشته باشید که اپل بخش زیادی از برتری خود را به لیتوگرافی فوقالعاده بهینهی TSMC مدیون است؛ در حالیکه لیتوگرافی ۵ نانومتری TSMC، تراکم ترانزیستور حدودی ۱۷۱٫۳۰ میلیون ترانزیستور بر میلیمتر مربع را فراهم میکند؛ لیتوگرافی Intel 7 تراکم ۱۰۰٫۷ میلیون ترانزیستور بر میلیمتر مربع را برای پردازندهی اینتل و لیتوگرافی ۸ نانومتری سامسونگ تراکم ناامیدکنندهی ۴۵٫۱ میلیون ترانزیستور بر میلیمتر مربع را برای گرافیک انویدیا فراهم میسازد.