جزئیات جدیدی از کارت های گرافیکی RTX و پردازنده های امپر انویدیا منتشر شد
انویدیا اطلاعات تکمیلی جدیدی را دربارهی کارتهای گرافیکی RTX 30 خود دراختیار رسانهها گذاشت. اطلاعات جدید، جزئیاتی از عملکرد و بهرهوری پردازندههای امپر (Ampere) موجود در کارتهای مذکور را هم دراختیار مخاطبان قرار میدهد. اطلاعات تکمیلی، بخشی از برنامهی بررسی عمیق محصولات انویدیا هستند که پردازندههای گرافیکی گیمینگ امپر مدلهای GA 102 و GA 104 را مورد بررسی قرار میدهند. پردازندههای مذکور، بهزودی و در قالب کارتهای گرافیکی جدید دراختیار مصرفکنندهها قرار میگیرند.
همانطور که گفته شد، اطلاعات جدید انویدیا پیرامون محصولات جدید، علاوه بر اشارهی مجدد به برخی از جزئیات RTX 30، بیشتر روی تواناییها و جزئیات پردازندهی گرافیکی امپر متمرکز میشود. انویدیا جلسهی پرسش و پاسخی هم در ردیت برگزار کرد که اطلاعاتی جزئی در آن دراختیار مخاطبان قرار گرفت. اطلاعات جلسهی مذکور بیشتر حول طراحی SM برای پردازندههای گرافیکی امپر تمرکز داشت. ابتدا، نگاهی به پردازندههای گرافیکی داریم که در دل کارتهای RTX 30 قرار گرفتهاند.
پردازندهی گرافیکی پرچمدار GA102 (مخصوص RTX 3080 و RTX 3090)
پردازنده گرافیمی GA102 بهعنوان محصول پرچمدار انویدیا در خانوادهی گیمینگ جدید شناخته میشود که در قالبی با ابعاد ۶۲۸ میلیمتر مربع ساخته میشود. در مجموع، ۲۸ میلیارد ترانزیستور در این تراشه استفاده شده است. انویدیا میگوید تراشهی GA102 شامل ۶ واحد GPC (مخفف Graphics Processing Clusters) میشود و همچنین ۶ واحد TPC (مخفف Texture Processing Clusters) در آن وجود دارد. تراشهی GA102 در RTX 3090 از ۴۱ واحد TPC یا ۸۲ واحد SM استفاده میکند، درحالیکه در RTX 3080 این اعداد به ۳۴ واحد TPC یا ۶۸ واحد SM میرسند. هر واحد SM در پردازندههای گرافیکی اتمپر شامل ۱۲۸ هستهی CUDA میشود که دارای ساختار بازطراحیشده هستند و در ادامه، جزئیات آنها را شرح میدهیم. پردازندهی GA102 در RTX 3080 دارای ۱۰،۴۹۶ هسته است، درحالیکه در RTX 3080 شاهد ۸،۷۰۴ هسته هستیم.
پردازندهی گرافیکی GA102 ازلحاظ چگالی، دوبرابر پردازندهی تورینگ TU102 است و در هر میلیمتر مربع، ۴۴/۵۶ میلیون ترانزیستور دارد. در مدل قبلی، در هر میلیمتری مربع، ۲۴/۶۷ میلیون ترانزیستور وجود داشت. دلیل اصلی افزایش چگالی را میتوان بهرهبرداری از روش تولید هشت نانومتری سامسونگ در پردازندههای جدید دانست.
هر واحد SM در پردازندهی گرافیکی جدید شامل چهار هستهی تنسور و یک هستهی RT میشود. پردازندهی گرافیکی GA102 از یک حافظهی کش L2 مشترک بهره میبرد. RTX 3090 دارای ۶ و RTX 3080 دارای پنج مگابایت حافظهی کش است. دیاگرام بلوکی اختصای پردازندهی گرافیکی که ازسوی انویدیا دراختیار رسانهها قرار گرفت، مجموع ۱۰ کنترلر ۳۲ بیتی حافظه را در RTX 3080 نشان میدهد که باس ۳۲۰ بیتی را بههرماه دارد. کارت گرافیک RTX 3090 دارای ۱۲ کنترلر ۳۲ بیتی حافظه خواهد بود که رابط باس ۳۸۴ بیتی را بههمراه میآورد.
پردازندهی گرافیکی GA104 (مخصوص RTX 3070)
در دل کارت گرافیک انویدیا RTX 3070، پردازندهی گرافیکی GA104 قرار دارد. این تراشه، یکی از چندین پردازندهی گرافیکی امپر محسوب میشود که در دستهی گیمینگ به بازار خواهد آمد. GA104 دومین تراشهی سریع امپر در خانوادهی جدید محسوب میشود که آن هم با روش تولید هشت نانومتری سامسونگ ساخته شده است. پردازندهی گرافیکی مذکور، ابعاد ۳۵۹/۲ میلیمتر مربعی داشته و ۱۷/۴ میلیارد ترانزیستور در آن قرار دارد. تعداد ترانزیستورهای GA104 حدود ۹۳ درصد تعداد ترانزیستور GA102 میشود. فراموش نکنید که GA104 ابعادی نصف GA102 دارد و درنتیجه چگالی بسیار بالایی را در آن شاهد هستیم.
انویدیا در RTX 3070 از ۴۶ واحد SM استفاده میکند که در مجموع، ۵،۸۸۸ هستهی CUDA را دراختیار کاربر میگذارد. کارت گرافیکی RTX 3070 علاوه بر هستههای CUDA مجهز به نسل دوم هستههای رهگیری پرتو یا همان RT نیز میشود. همچنین نسل جدید هستههای تنسور و SM کاملا جدید برای استریم چندگانهی داده در واحدها در کارت جدید استفاده میشوند. پردازندهی گرافیکی GA104 شامل ۱۸۴ هستهی تنسور و ۴۶ هستهی RT میشود. البته احتمال زیادی وجود دارد که GA104 با پیکربندی ۶،۱۴۴ هستهای عرضه شود که شاید در یک محصول آتی شاهد آن باشیم. پردازندهی GA104 از چهار مگابایت حافظهی کش L2 اشتراکی بهره میبرد و در مجموع، هشت کنترلر حافظهی ۳۲ بیتی در آن دیده میشود. درنتیجه رابط باس این کارت گرافیک، ۲۵۶ بیتی است.
مشخصات فنی کارتهای گرافیک RTX 30 مجهز به پردازندههای انویدیا امپر
نام کارت گرافیک | انویدیا GeForce RTX 3070 | انویدیا GeForce RTX 3080 | انویدیا GeForce RTX 3090 |
---|---|---|---|
نام پردازنده گرافیکی | Ampere GA104-300 | Ampere GA102-200 | Ampere GA102-300 |
روش تولید | هشت نانومتری سامسونگ | هشت نانومتری سامسونگ | هشت نانومتری سامسونگ |
ابعاد قالب | ۳۹۵/۲ میلیمتر مربع | ۶۲۸/۴ میلیمتر مربع | ۶۲۸/۴ میلیمتر مربع |
تعداد ترانزیستور | ۱۷/۴ میلیارد | ۲۸ میلیارد | ۲۸ میلیارد |
تعداد هستههای CUDA | ۵،۸۸۸ | ۸،۷۰۴ | ۱۰،۴۹۶ |
TMU/ROP | نامشخص | نامشخص | نامشخص |
هستههای Tensor/RT | 184/46 | 272/68 | 328/82 |
کلاک پایه | ۱۵۰۰ مگاهرتز | ۱۴۴۰ مگاهرتز | ۱۴۰۰ مگاهرتز |
کلاک تقویتشده | ۱۷۳۰ مگاهرتز | ۱۷۱۰ مگاهرتز | ۱۷۰۰ مگاهرتز |
قدرت پردازشی FP32 | ۲۰ ترافلاپس | ۳۰ ترافلاپس | ۳۶ ترافلاپس |
ترافلاپس RT | ۴۰ ترافلاپس | ۵۸ ترافلاپس | ۶۹ ترافلاپس |
TOPs هستههای تنسور | ۱۶۳ | ۲۳۸ | ۲۸۵ |
ظرفیت حافظه | ۸ یا ۱۶ گیگابایت GDDR6 | ۱۰ یا ۲۰ گیگابایت GDDR6X | ۲۴ گیگابایت GDDR6X |
باس حافظه | ۲۵۶ بیت | ۳۲۰ بیت | ۳۸۴ بیت |
سرعت حافظه | ۱۴ گیگابیتبرثانیه | ۱۹ گیگابیتبرثانیه | ۱۹/۵ گیگابیتبرثانیه |
پهنای باند | ۴۴۸ گیگابیتبرثانیه | ۷۶۰ گیگابیتبرثانیه | ۹۳۶ گیگابیتبرثانیه |
توان طراحی گرمایی | ۲۲۰ وات | ۳۲۰ وات | ۳۵۰ وات |
قیمت | ۴۹۹ دلار | ۶۹۹ دلار | ۱۴۹۹ دلار |
تاریخ عرضه | اکتبر ۲۰۲۰ | ۱۷ سپتامبر ۲۰۲۰ | ۲۴ سپتامبر ۲۰۲۰ |
طراحی پردازندهی جریان یا SM در انویدیا امپر
کارتهای گرافیکی RTX 30 انویدیا مجهز به پردازندههای امپر، با طراحی کاملا جدیدی در بخش SM همراه هستند. در ادامه، جزئیات کاملی از طراحی جدید SM در معماری امپر میخوانید.
تونی تاماسی از تیم انویدیا میگوید یکی از اهداف مهم طراحی در SM در کارتهای گرافیکی RTX 30 با پردازندهی امپر، رسیدن به دوبرابر جریان عملیایتی FP32 نسبت به معماری تورینگ بوده است. واحد SM در پردازندههای امپر برای رسیدن به این هدف از طراحی مسیر دادهای جدید برای فرایندهای عملیاتی FP32 و INT32 بهره میبرند. هر مسیر داده در هر جهت، شامل ۱۶ هستهی FP32 CUDA میشود که توانایی اجرای ۱۶ عملیات FP32 را در هر چرخهی کلاک دارند. مسیر دادهای دیگر شامل ۱۶ هستهی FP32 و ۱۶ هستهی INT32 میشود. درنتیجهی این طراحی جدید، هریک از بخشهای Ampere SM در هر کلاک توانایی اجرای ۳۲ عملیات FP32 یا ۱۶ عملیات FP32 بههمراه ۱۶ عملیات INT32 را دارد. همهی چهار بخش SM در ترکیب با یکدیگر میتوانند ۱۲۸ عملیات FP32 را در یک کلاک انجام دهند که دوبرابر نرخ FP32 در واحدهای SM معماری تورینگ میشود. همچنین آنها میتوانند در هر کلاک، ۶۴ عملیات FP32 و ۶۴ عملیات INT32 انجام دهند.
طراحی جدید واحد SM در کارتهای جدید RTX 30 کی از عوامنل اصلی افزایش سرعت آنها است
دوبرابر کردن سرعت پردازش برای FP32، قدرت و عملکرد را برای تعدادی از فرایندها و الگوریتمهای مرسوم گرافیکی بهبود میبخشد. فرایندهای سایهزنی مدرن عموما ترکیبی از دستورالعملهای FP32 حسابی مانند FFMA و FADD و FMUL دارند که با دستورالعملهای سادهتر همچون جمع اعداد صحیح برای پیدا و دریافت کردن داده، مقایسههای ممیز شناور، پردازشهای حداقل/حداکثر و موارد دیگر میشود. بهبود عملکرد بسته به سطح سایهزنی یا اپلیکیشن در پردازشها متفاوت خواهد بود که به مجموعهای از دستورالعملها وابسته میشود. سایهزنهای حذف نویز در رهگیری پرتو مثالهای خوبی هستند که احتمالا از دوبرابر شدن جریانهای دادهای در FP32 سود میبرند.
دوبرابر کردن جریان خروجی محاسبه در پردازنده، نیازمند دوبرابر کردن مسیرهای دادهای بود که از آنها پشتیبانی میکردند. بههمین دلیل در Ampere SM شاهد دوبرابر شدن حافظهی اشتراکی و عملکرد کش L1 در SM هستیم. در SM امپر شاهد ۱۲۸ بایت در هر کلاک هستیم که در تورینگ، ۶۴ بایت در هر کلاک بود. انویدیا، پهنای باند L1 برای GeForce RTX 3080 را ۲۱۹ گیگابایتبرثانیه اعلام میکند که در مقایسه با ۱۱۶ گیگابایتبرثانیه در GeForce RTX 2080 Super یک بهبود قابلتوجه محسوب میشود.
تاماسی در ادامهی صحبتهایش میگوید امپر هم مانند نسلهای قبلی پردازندههای انویدیا، مجهز به GPC، TPC، SM و ROP است که درکنار کنترلرهای حافظه عمل میکنند. واحد GPC را میتوان یک بلوک سختافزاری سطح بالا با سلطهی بیشتر دانست. تمامی واحدهای پردازشی گرافیکی کلیدی در داخل GPC قرار میگیرند. هر GPC شامل یک موتور اختصاصی Raster میشود که در طراحی جدید، دو پارتیشن ROP هم در آن قرار گرفتهاند. هر پارتیشن، شامل هشت واحد ROP (مخفف Raster Operators) میشود. اضافه شدن ROP را میتوان قابلیت جدید پردازندههای گرافیکی مبتنی بر معماری امپر در دستهی GA10x دانست. تاماسی در پایان صحبتهایش میگوید که بهزودی جزئیات بیشتر را در سند فنی انویدیا امپر منتشر خواهند کرد.
با نگاهی دقیقتر به واحد SM در امپر، متوجه وجود ۱۲۸ واحد FP32 در هر بلوک میشویم. یکی از دو مسیر دادهای FP32 میتواند بهصورت همزمان فرایندهای عملیاتی INT32 را هم انجام دهد. هزینههای تنسور شامل چهار واحد میشوند. چهار واحد بافت و یک هستهی RT هم در هر SM دیده میشود.
انویدیا برای هستههای نسل سومی تنسور، از همان معماری Smarsity استفاده میکند که در خانوادهی محصولات Ampere HPC هم استفاده شده بود. امپر از چهار هستهی تنسور در هر SM بهره میبرد که کمتر از هشت هستهی موجود در هر SM در تورینگ است. ازطرفی آنها نهتنها از طراحی نسل سوم بهره میبرند، بلکه جریانهای SM بزرگتری هم دارند که موجب افزایش تعداد میشود. پردازندههای گرافیکی امپر توانایی اجرای ۱۲۸ فرایند عملیاتی FP16 FMA را در هر هستهی تنسور دارند که از کل هستههای INT16 بهره میبرد و با بهکار گرفتن معماری Sparsity تا ۲۵۶ افزایش پیدا میکند. مجموع فرایندهای عملیاتی FP16 FMA به ۵۱۲ میرسد و با بهکارگیری معماری مذکور، میتوان آن را به ۱۰۲۴ رساند. اعداد مذکور، نشاندهندهی بهبود دوبرابری نسبت به پردازندههای گرافیکی تورینگ هستند که بهلطف طراحی بهروز تنسور ممکن میشود.
فرایندهای بهبود بالا برای هستههای رهگیری پرتو هم رخ میدهد که در نسل دوم، دوبرابر تداخل پرتو را نسبت به معماری تورینگ در پی دارند. بیشتر بودن تعداد واحدهای SM همچنین باعث افزایش تعداد هستههای RT هم میشود که عملکرد کلی و شتابدهی رهگیری پرتو را بهمیزان قابلتوجهی در امپر افزایش میدهد.
حافظهی GDDR6X، تکامل بعدی در دنیای گرافیک
حافظههای Micron GDDR6X دستاوردهای مهمی در کارتهای گرافیکی جدید دارند. این حافظهها سریعتر هستند و درکنار دوبرابر کردن نرخ دادهی I/O، برای اولینبار از سیگنالدهی PAM4 چندسطحی در قالبهای حافظه بهره میبرند. حافظههای مذکور در کلاس محصولات انویدیا RTX 3090 به پهنای باند تا یک ترابایت میرسند که برای اجرای بازیهای حرفهای نسل بعد در رزولوشن 8K عالی خواهند بود.
مشخصات و قابلیتهای GDDR6X SGRAM جدید
- نرخ دادهی SGRAM در حافظههای جدید نسبت به نسل قبلی دوبرابر میشود که در هر تراکنش، توان کمتری هم مصرف میکنند و از مرز یک ترابایتبرثانیه در پهنای باند حافظهی سیستمی فراتر میروند.
- این حافظهها، اولین دستگاههای حافظهای اختصاصی گرافیک محسوب میشوند کع از سیگنالدهی رمزنگاری شدهی PAM4 بین پردازنده و DRAM بهره میبرند. در سیستم جدید، از چهار سطح ولتاژ برای رمزنگاری و جابهجایی دو بیت از داده در هر کلاک رابط استفاده میشود.
- حافظههای جدید را میتوان در سرعتهای بسیار بالا با پایداری مناسب طراحی کرد و به کار انداخت. امکان تولید انبوه آنها نیز اکنون فراهم شده است.
همانطور که گفته شد، GDDR6X از سیگنالدهی چندسطحی PAM4 جدید استفاده کرده که سرعت انتقال داده را بسیار سریعتر میکند. همچنین نرخ I/O نیز بهبود پیدا میکند و ظرفیت هر قالب حافظه در آن از ۶۴ به ۸۴ گیگابیتبرثانیه میرسد. قالبهای حافظهی Micron GDDR6x همچنین تنها DRAMهای مخصوص گرافیک هستند که میتوان با وجود بهرهگیری از PAM4 آنها را بهصورت انبوه تولید کرد.
نکتهی جذاب دربارهی حافظههای GDDR6X اینکه میتوان سرعت آنها را تا ۲۱ گیگابیتبرثانیه افزایش داد. البته در RTX 3090 شاهد حداکثر سرعت ۱۹/۵ گیگابیتبرثانیه در آنها هستیم. ظاهرا تولیدکنندهها میتوانند قالبهایی با ظرفیت بیشتر را هم از مایکرون خریداری کنند. مایکرون همچنین تأیید میکند که برنامههایی برای افزایش سرعت حافظهها تا بیش از ۲۱ گیگابیتبرثانیه در سال ۲۰۲۱ داد، اما هنوز مشخص نیست که چه کارتهایی از این حافظهها بهره خواهند برد.
حافظههای مایکرون GDDR6X نهتنها سرعت بیشتر، بلکه پهنای باند بیشتری را هم با ۱۵ درصد توان مصرفی کمتر نسبت به نسل قبل ارائه میکنند.
مشخصات حافظههای GDDR6X در مقایسه با نسلهای قبل
نام حافظه | GDDR5 | GDDR5X | GDDR6 | GDDR6X |
---|---|---|---|---|
چگالی | از ۵۱۲ مگابایت تا هشت گیگابایت | هشت گیگابایت | هشت گیگابایت و ۱۶ گیگابایت | هشت گیگابایت و ۱۶ گیگابایت |
VDD و VDDQ | ۱/۵ یا ۱/۳۵ ولت | ۱/۳۵ ولت | ۱/۳۵ یا ۱/۲۵ ولت | ۱/۳۵ یا ۱/۲۵ ولت |
VPP | نامشخص | ۱/۸ ولت | ۱/۸ ولت | ۱/۸ ولت |
نرخ داده | تا هشت گیگابیتبرثانیه | تا ۱۲ گیگابیتبرثانیه | تا ۱۶ گیگابیتبرثانیه | ۱۹ و ۲۱ و بیشتر از ۲۱ گیگابیتبرثانیه |
تعداد کانال | ۱ | ۱ | ۲ | ۲ |
Access granularity | ۳۲ بایت | ۶۴ بایت - ۲ عدد ۳۲ بایتی در حالت pseuso 32B | دو کانال ۳۲ بایتی | دو کانال ۳۲ بایتی |
Burst length | ۸ | ۱۶ یا ۸ | ۱۶ | ۸ در حالت PAM4 و ۱۶ در حالت RDQS |
سیگنالدهی | POD15/POD135 | POD135 | POD135/POD125 | PAM4 POD135/POD125 |
پکیج | BGA-170 14x12x0.8mm ball pitch | BGA-190 14x12x0.65mm ball pitch | BGA-180 14x12x0.75mm ball pitch | BGA-180 14x12x0.75mm ball pitch |
عرض I/O | x32/x16 | x32/x16 | دو کانال x16/x8 | دو کانال x16/x8 |
تعداد سیگنال | 61 - 40 DQ, DBI, EDC - 15 CA - 6 CK, WCK | 61 - 40 DQ, DBI, EDC - 15 CA - 6 CK, WCK | 70 یا 74 - 40 DQ, DBI, EDC - 24 CA - 6 or 10 CK, WCK | 70 یا 74 - 40 DQ, DBI, EDC - 24 CA - 6 or 10 CK, WCK |
PLL, DCC | PLL | PLL | PLL,DCC | DCC |
CRC | CRC-8 | CRC-8 | دو عدد CRC-8 | دو عدد CRC-8 |
VREFD | در هر دو بایت، داخلی یا خارجی | داخلی در هر بایت | داخلی در هر پین | داخلی در هر پین، سه گیرندهی زیرمجموعه در هر پین |
Equalization | نامشخص | RX/TX | RX/TX | RX/TX |
VREFC | خارجی | خارجی یا داخلی | خارجی یا داخلی | خارجی یا داخلی |
خود نوسازی یا SRF | بله، SRF موقتی کنترلشده | بله، SRF موقتی کنترلشده و SRF هایبرنیت | بله، SRF موقتی کنترلشده و SRF هایبرنیت VDDQ-off | بله، SRF موقتی کنترلشده و SRF هایبرنیت VDDQ-off |
اسکن | SEN | IEEE 1149.1 JTAG | IEEE 1149.1 JTAG | IEEE 1149.1 JTAG |
طراحی سیستم خنککننده در GeForce RTX 30
انویدیا یکی از بهترین طراحیهای سیستم گرمایی Founders Edition را در کارتهای گرافیکی RTX 30 پیادهسازی کرده است. تیم سبز میگوید عملکرد بهتر و سریعتر کارتهای گرافیکی جدید، نیازمند راهکارهای خنککنندهی بهتر بود و به همین دلیل، آنها راهکاری مخصوص را برای نسل بعدی کارتهای گرافیکی خود بهکار گرفتهاند. این راهکارهای جدید، پردازندهی گرافیکی را در دمای پایین نگه میدارند و با پیادهسازی فناوریهای متعدد موجود و تعدادی فناوری جدید، جلوی افزایش بیشازحد صدای عملیاتی را هم میگیرند.
سیستم خنککنندهی جدید فاندرز ادیشن از یک هیتسینک مخصوص با آلیاژ آلومینیم استفاده میکند که با بهرهمندی از محفظهی بخار و فنهای مبتنی بر فناوری محوری دوسویه، عملکردی عالی دارد. هیتسینک خنککننده از یک پوشش نانوکربن بهره میبرد که قطعا در کنترل کردن دما موفق خواهد بود.
طراحی سیستم خنککنندهی جدید در RTX 30 بسیار منحصربهفرد بهنظر میرسد. این اولین طراحی در نوع خود محسوب میشود که آخرین بار نمونهای مشابه با آن را در GTX 780 با هیتسینکی بزرگ دیده بودیم.
در طراحی سیستم خنککنندهی جدید، موقعیتهای خاصی برای قرارگیری فن دیده میشود که یکی در جلو و دیگری در پشت کارت قرار میگیرد. این پیکربندی کشش و مکش که با ترکیب فن دوگانه ایجاد میشود، گرما را با عملکردی سادهتر و بهینهتر از خروجی بخار کارت گرافیک استخراج میکند. البته کمی هوا به داخل کیس انتقال داده میشود که باتوجهبه قدرت و کیفیت بالای سیستمهای خنککنندهی کنونی و بهرهمندی از خنککنندههای مایع، مشکل زیادی ایجاد نخواهد کرد.
انویدیا تأکید میکند که طراحی جدید فاندرز ادیشن صدای کمتری نسبت به خنککنندههای سنتی دومحوره دارد و همچنین عملکردی دوبرابر بهتر از آنها را ارائه میکند. تغییر در طراحی مصرف توان و خصوصا NVLink نقش مهمی در بهبود عملکرد سیستم خنککننده داشته است. تغییرات جدید، جریان بهتر هوا را در از میان بزرگترین مجموعهی فین طراحیشده تا به امروز، آسانتر میکند. منافذ براکتی بزرگتر در ساختار خنککننده در ترکیب با فینهای خاص، جریان بزرگتری از هوا را ممکن میکنند. از هر جهت که نگاه کنید، طراحی فاندرز ادیشن با تمرکز بر افزایش جریان هوا انجام شده است. به حداقل رساندن دما و رسیدن به بالاترین سطح عملکرد با کمترین صدا، همگی در طراحی جدید لحاظ شدهاند.
کارت گرافیک RTX 3080 در مبحث صدای خنککننده و عملکرد، در حداکثر دمای ۷۸ درجهی سانتیگراد عمل میکند. کارت گرافیک مذکور برای رسیدن به حداکثر باید به توان ۳۲۰ وات برسد که در آن حالت، خروجی صدای ۳۰ دسیبل خواهد داشت. در مقام مقایسه، کارت گرافیک تورینگ فاندر ادیشن حداکثر دمای ۸۱ درجهی سانتیگراد داشت و حداکثر صدای آن نیز با توان ۲۴۰ وات، ۳۲ دسیبل گزارش میشد (کارت گرافیک RTX 2080 Super).
در آزمایشهای اختصاصی تیم سبز، RTX 3080 فرکانس میانگین ۱۹۲۰ مگاهرتز را با توان مصرفی ۳۱۰ وات ثبت میکند که حداکثر دمای آن را به ۷۶ درجه میرساند. انویدیا در همین مقایسه، فاکتور ۱/۹ برابر را مطرح کرده و ادعا میکند که RTX 3080 با صدا و دمای کمتر امکان ارائهی خروجی ۱۰۰ فریمبرثانیه را دارد که در مقایسه با ۶۰ فریمبرثانیهی نسل قبلی، یک پیشرفت محسوب میشود.
طراحی برد PCB و توان RTX 3080 و RTX 3090
یکی از تغییرهای عمدهای که در کارت گرافیک RTX 3090 Founders Edition دیده میشود، در طراحی PCB نهفته است. کارتهای گرافیکی RTX 3080 و RTX 3090 با پکیجینگ منحصربهفرد و کامپکت PCB طراحی و ساخته میشوند که قبلا در فضای مصرفکننده در هیچجا دیده نشده بود. ازطرفی کامپکت بودن طراحی بدین معنی نیست که کارتها توان مصرفی زیای ندارند. انویدیا در همین کارتهای کامپکت مجموعهای با توان طراحی بسیار بالا قرار داده است.
برد PCB در کارتهای جدید انویدیا شامل ۲۰ بخش مصرفکنندهی توان میشود که طراحی خاص و حرفهای آن را در مقایسه با کارتهای RTX 20 پرچمدار نشان میدهد. پردازندهی گرافیکی توان مورد نیاز خود را از ۱۸ فاز دریافت میکند و توان حافظه نیز از دو فاز دیگر تأمین میشود. انویدیا میگوید این نوع از PCB یک محصول عالی برای اورکلاک محسوب میشود که کاربران با استفاده از آن، به توانهای بسیار بالاتری خواهند رسید. البته PCB در نسخهی فاندرز ادیشن با نسخهی عادی تفاوت دارد و در نسخههای مرسوم، از همان طراحی چهارگوش استفاده میشود.
کارتهای گرافیکی RTX 30 مدل فاندرز ادیشن علاوه بر طراحی جدید، از کانکتورهای برق ۱۲ پینی Micro-Fit 3.0 بهره میبرند. این کانکتورها نیازی به ارتقا منبع تغذیه ایجاد نمیکنند چون با رابطهای 2x8pin به 1x12pin عرضه میشوند و میتوان بدون مشکل تأمین توان، از آنها بهره برد.
جانمایی کانکتورهای ۱۲ پینی روی PCB در کارتهای جدید انویدیا یک نوآوری دیگر را از تیم سبز نشان میدهد. پینها بهصورت عمودی جانمایی شدهاند و باتوجهبه طراحی PCB، میتوان دلیل استفاده از طراحی ۱۲ پینی را بهجای طراحی استاندارد هشت پینی استاندارد متوجه شد. در PCB فضای محدودی برای انجام فرایندهای اینچنینی وجود دارد و باید از ورودی توان کوچکتر استفاده میشد.
عملکرد، زمان عرضه و قیمت RTX 30
انویدیا در اطلاعات تکمیلی خود جزئیاتی از اعداد و ارقام توان در کارتهای گرافیکی جدید منتشر کرد. در نمودارهای زیر، توان و عملکرد کارتهای RTX 3070 و RTX 3080 و RTX 3090 v را مشاهده میکنید.
انویدیا هنوز هیچ آمار و ارقام دقیقی دربارهی کارتهای جدید سری RTX 30 منتشر نکرده است، اما باتوجهبه همین رونمایی کلی هم میتوان پیشبینی کرد که RTX 3070 عملکردی بالاتر از RTX 2080 Ti دارد و RTX 3080 بسیار بهتر از RTX 2080 Ti خواهد بود. کارت گرافیک پرچمدار RTX 3090 هم که سرعتی تقریبا ۵۰ درصد بهتر از RTX 2080 Ti دارد و بهبودی عالی را در مجموعهی خانوادهی جدید نشان میدهد.
درواقع انویدیا پیشنمایشی کلی را از عملکرد و قدرت کارتهای جدید به نمایش گذاشت. آنها پیشنمایشی از Doom Eternal را با RTX 3080 نمایش دادند که بسیار بهتر از RTX 2080 Ti ظاهر شد و همچنین توانایی عالی کارت در اجرای بازیهای 4K هم به نمایش گذاشته شد. در اکثر بازیهای AAA، کارتهای جدید انویدیا توانایی رسیدن به حداکثر نرخ فریم ۶۰ فریمبرثانیه را دارند.
درنهایت نوبت به اطلاعات قیمت و زمان عرضهی کارتهای جدید انویدیا میرسد. تیم سبز میگوید RTX 3080 اول از همه و در تاریخ ۱۷ سپتامبر به بازار عرضه میشود. پس از آن نوبت RTX 3090 خواهد بود که ۲۴ سپتامبر به بازار میآید و درنهایت RTX 3070 در ماه اکتبر به مصرفکنندهها عرضه میشود. ازلحاظ قیمت نیز کارتها بهترتیب ۱،۴۹۹ و ۶۹۹ و ۴۹۹ دلار قیمت خواهند داشت. بهزودی نسخههای سفارشی و پرمیوم نیز با قیمتهای متنوع معرفی میشوند.