جزئیات جدیدی از کارت های گرافیکی RTX و پردازنده ‌های امپر انویدیا منتشر شد

یک‌شنبه ۱۶ شهریور ۱۳۹۹ - ۱۵:۴۵
مطالعه 19 دقیقه
اخبار و اطلاعات جدیدی از پردازنده‌های گرافیکی انویدیا امپر به‌همراه قدرت و کارایی کارت‌های گرافیکی RTX 3070 و RTX 3080 و RTX 3090 منتشر شده است.
تبلیغات

انویدیا اطلاعات تکمیلی جدیدی را درباره‌ی کارت‌های گرافیکی RTX 30 خود دراختیار رسانه‌ها گذاشت. اطلاعات جدید، جزئیاتی از عملکرد و بهره‌وری پردازنده‌های امپر (Ampere) موجود در کارت‌های مذکور را هم دراختیار مخاطبان قرار می‌دهد. اطلاعات تکمیلی، بخشی از برنامه‌ی بررسی عمیق محصولات انویدیا هستند که پردازنده‌های گرافیکی گیمینگ امپر مدل‌های GA 102 و GA 104 را مورد بررسی قرار می‌دهند. پردازنده‌های مذکور، به‌زودی و در قالب کارت‌های گرافیکی جدید دراختیار مصرف‌کننده‌ها قرار می‌گیرند.

همان‌طور که گفته شد، اطلاعات جدید انویدیا پیرامون محصولات جدید، علاوه بر اشاره‌ی مجدد به برخی از جزئیات RTX 30، بیشتر روی توانایی‌ها و جزئیات پردازنده‌ی گرافیکی امپر متمرکز می‌شود. انویدیا جلسه‌ی پرسش و پاسخی هم در ردیت برگزار کرد که اطلاعاتی جزئی در آن دراختیار مخاطبان قرار گرفت. اطلاعات جلسه‌ی مذکور بیشتر حول طراحی SM برای پردازنده‌های گرافیکی امپر تمرکز داشت. ابتدا، نگاهی به پردازنده‌های گرافیکی داریم که در دل کارت‌های RTX 30 قرار گرفته‌اند.

کپی لینک

پردازنده‌ی گرافیکی پرچم‌دار GA102 (مخصوص RTX 3080 و RTX 3090)

پردازنده‌ گرافیمی GA102 به‌عنوان محصول پرچم‌دار انویدیا در خانواده‌ی گیمینگ جدید شناخته می‌شود که در قالبی با ابعاد ۶۲۸ میلی‌متر مربع ساخته می‌شود. در مجموع، ۲۸ میلیارد ترانزیستور در این تراشه استفاده شده است. انویدیا می‌گوید تراشه‌ی GA102 شامل ۶ واحد GPC (مخفف Graphics Processing Clusters) می‌شود و همچنین ۶ واحد TPC‌ (مخفف Texture Processing Clusters) در آن وجود دارد. تراشه‌ی GA102 در RTX 3090 از ۴۱ واحد TPC یا ۸۲ واحد SM استفاده می‌کند، درحالی‌که در RTX 3080 این اعداد به ۳۴ واحد TPC یا ۶۸ واحد SM می‌رسند. هر واحد SM در پردازنده‌های گرافیکی اتمپر شامل ۱۲۸ هسته‌ی CUDA می‌شود که دارای ساختار بازطراحی‌شده هستند و در ادامه، جزئیات آن‌ها را شرح می‌دهیم. پردازنده‌ی GA102 در RTX 3080 دارای ۱۰،۴۹۶ هسته است، درحالی‌که در RTX 3080 شاهد ۸،۷۰۴ هسته هستیم.

پردازنده‌ی گرافیکی GA102 ازلحاظ چگالی، دوبرابر پردازنده‌ی تورینگ TU102 است و در هر میلی‌متر مربع، ۴۴/۵۶ میلیون ترانزیستور دارد. در مدل قبلی، در هر میلی‌متری مربع، ۲۴/۶۷ میلیون ترانزیستور وجود داشت. دلیل اصلی افزایش چگالی را می‌توان بهره‌برداری از روش تولید هشت نانومتری سامسونگ در پردازنده‌های جدید دانست.

مشخصات جزئی RTX 3080

هر واحد SM در پردازنده‌ی گرافیکی جدید شامل چهار هسته‌‌ی تنسور و یک هسته‌ی RT می‌شود. پردازنده‌ی گرافیکی GA102 از یک حافظه‌ی کش L2 مشترک بهره می‌برد. RTX 3090 دارای ۶ و RTX 3080 دارای پنج مگابایت حافظه‌ی کش است. دیاگرام بلوکی اختصای پردازنده‌ی گرافیکی که ازسوی انویدیا دراختیار رسانه‌ها قرار گرفت، مجموع ۱۰ کنترلر ۳۲ بیتی حافظه را در RTX 3080 نشان می‌دهد که باس ۳۲۰ بیتی را به‌هرماه دارد. کارت گرافیک RTX 3090 دارای ۱۲ کنترلر ۳۲ بیتی حافظه خواهد بود که رابط باس ۳۸۴ بیتی را به‌همراه می‌آورد.

کپی لینک

پردازنده‌ی گرافیکی GA104 (مخصوص RTX 3070)

در دل کارت گرافیک انویدیا RTX 3070، پردازنده‌ی گرافیکی GA104 قرار دارد. این تراشه، یکی از چندین پردازنده‌ی گرافیکی امپر محسوب می‌شود که در دسته‌ی گیمینگ به بازار خواهد آمد. GA104 دومین تراشه‌ی سریع امپر در خانواده‌ی جدید محسوب می‌شود که آن هم با روش تولید هشت نانومتری سامسونگ ساخته شده است. پردازنده‌ی گرافیکی مذکور، ابعاد ۳۵۹/۲ میلی‌متر مربعی داشته و ۱۷/۴ میلیارد ترانزیستور در آن قرار دارد. تعداد ترانزیستورهای GA104 حدود ۹۳ درصد تعداد ترانزیستور GA102 می‌شود. فراموش نکنید که GA104 ابعادی نصف GA102 دارد و درنتیجه چگالی بسیار بالایی را در آن شاهد هستیم.

معماری انویدیا امپر
معماری انویدیا امپر نسل دوم RTX
معماری انویدیا تورینگ
کارت گرافیک Nvidia GeForce RTX 3090 و 3080 و 3070 کنار هم

انویدیا در RTX 3070 از ۴۶ واحد SM استفاده می‌کند که در مجموع، ۵،۸۸۸ هسته‌ی CUDA را دراختیار کاربر می‌گذارد. کارت گرافیکی RTX 3070 علاوه بر هسته‌های CUDA مجهز به نسل دوم هسته‌های رهگیری پرتو یا همان RT نیز می‌شود. همچنین نسل جدید هسته‌های تنسور و SM کاملا جدید برای استریم چندگانه‌ی داده در واحدها در کارت جدید استفاده می‌شوند. پردازنده‌ی گرافیکی GA104 شامل ۱۸۴ هسته‌ی تنسور و ۴۶ هسته‌ی RT می‌شود. البته احتمال زیادی وجود دارد که GA104 با پیکربندی ۶،۱۴۴ هسته‌ای عرضه شود که شاید در یک محصول آتی شاهد آن باشیم. پردازنده‌ی GA104 از چهار مگابایت حافظه‌ی کش L2 اشتراکی بهره می‌برد و در مجموع، هشت کنترلر حافظه‌ی ۳۲ بیتی در آن دیده می‌شود. درنتیجه رابط باس این کارت گرافیک، ۲۵۶ بیتی است.

کپی لینک

مشخصات فنی کارت‌های گرافیک RTX 30 مجهز به پردازنده‌های انویدیا امپر

نام کارت گرافیک

انویدیا GeForce RTX 3070

انویدیا GeForce RTX 3080

انویدیا GeForce RTX 3090

نام پردازنده گرافیکی

Ampere GA104-300

Ampere GA102-200

Ampere GA102-300

روش تولید

هشت نانومتری سامسونگ

هشت نانومتری سامسونگ

هشت نانومتری سامسونگ

ابعاد قالب

۳۹۵/۲ میلی‌متر مربع

۶۲۸/۴ میلی‌متر مربع

۶۲۸/۴ میلی‌متر مربع

تعداد ترانزیستور

۱۷/۴ میلیارد

۲۸ میلیارد

۲۸ میلیارد

تعداد هسته‌های CUDA

۵،۸۸۸

۸،۷۰۴

۱۰،۴۹۶

TMU/ROP

نامشخص

نامشخص

نامشخص

هسته‌های Tensor/RT

184/46

272/68

328/82

کلاک پایه

۱۵۰۰ مگاهرتز

۱۴۴۰ مگاهرتز

۱۴۰۰ مگاهرتز

کلاک تقویت‌شده

۱۷۳۰ مگاهرتز

۱۷۱۰ مگاهرتز

۱۷۰۰ مگاهرتز

قدرت پردازشی FP32

۲۰ ترافلاپس

۳۰ ترافلاپس

۳۶ ترافلاپس

ترافلاپس RT

۴۰ ترافلاپس

۵۸ ترافلاپس

۶۹ ترافلاپس

TOPs هسته‌های تنسور

۱۶۳

۲۳۸

۲۸۵

ظرفیت حافظه

۸ یا ۱۶ گیگابایت GDDR6

۱۰ یا ۲۰ گیگابایت GDDR6X

۲۴ گیگابایت GDDR6X

باس حافظه

۲۵۶ بیت

۳۲۰ بیت

۳۸۴ بیت

سرعت حافظه

۱۴ گیگابیت‌برثانیه

۱۹ گیگابیت‌برثانیه

۱۹/۵ گیگابیت‌برثانیه

پهنای باند

۴۴۸ گیگابیت‌برثانیه

۷۶۰ گیگابیت‌برثانیه

۹۳۶ گیگابیت‌برثانیه

توان طراحی گرمایی

۲۲۰ وات

۳۲۰ وات

۳۵۰ وات

قیمت

۴۹۹ دلار

۶۹۹ دلار

۱۴۹۹ دلار

تاریخ عرضه

اکتبر ۲۰۲۰

۱۷ سپتامبر ۲۰۲۰

۲۴ سپتامبر ۲۰۲۰

کپی لینک

طراحی پردازنده‌ی جریان یا SM در انویدیا امپر

کارت‌های گرافیکی RTX 30 انویدیا مجهز به پردازنده‌های امپر، با طراحی کاملا جدیدی در بخش SM همراه هستند. در ادامه، جزئیات کاملی از طراحی جدید SM در معماری امپر می‌خوانید.

طراحی پردازنده‌ی جریان یا SM در انویدیا امپر

تونی تاماسی از تیم انویدیا می‌گوید یکی از اهداف مهم طراحی در SM در کارت‌های گرافیکی RTX 30 با پردازنده‌ی امپر، رسیدن به دوبرابر جریان عملیایتی FP32 نسبت به معماری تورینگ بوده است. واحد SM در پردازنده‌های امپر برای رسیدن به این هدف از طراحی مسیر داده‌ای جدید برای فرایندهای عملیاتی FP32 و INT32 بهره می‌برند. هر مسیر داده در هر جهت، شامل ۱۶ هسته‌ی FP32 CUDA می‌شود که توانایی اجرای ۱۶ عملیات FP32 را در هر چرخه‌ی کلاک دارند. مسیر داده‌ای دیگر شامل ۱۶ هسته‌ی FP32 و ۱۶ هسته‌ی INT32 می‌شود. درنتیجه‌ی این طراحی جدید، هریک از بخش‌های Ampere SM در هر کلاک توانایی اجرای ۳۲ عملیات FP32 یا ۱۶ عملیات FP32 به‌همراه ۱۶ عملیات INT32 را دارد. همه‌ی چهار بخش SM در ترکیب با یکدیگر می‌توانند ۱۲۸ عملیات FP32 را در یک کلاک انجام دهند که دوبرابر نرخ FP32 در واحد‌های SM معماری تورینگ می‌شود. همچنین آن‌ها می‌توانند در هر کلاک، ۶۴ عملیات FP32 و ۶۴ عملیات INT32 انجام دهند.

طراحی جدید واحد SM در کارت‌های جدید RTX 30 کی از عوامنل اصلی افزایش سرعت آن‌ها است

دوبرابر کردن سرعت پردازش برای FP32، قدرت و عملکرد را برای تعدادی از فرایندها و الگوریتم‌های مرسوم گرافیکی بهبود می‌بخشد. فرایندهای سایه‌زنی مدرن عموما ترکیبی از دستورالعمل‌های FP32 حسابی مانند FFMA و FADD و FMUL دارند که با دستورالعمل‌های ساده‌تر همچون جمع اعداد صحیح برای پیدا و دریافت کردن داده، مقایسه‌های ممیز شناور، پردازش‌های حداقل/حداکثر و موارد دیگر می‌شود. بهبود عملکرد بسته به سطح سایه‌زنی یا اپلیکیشن در پردازش‌ها متفاوت خواهد بود که به مجموعه‌ای از دستورالعمل‌ها وابسته می‌شود. سایه‌زن‌های حذف نویز در رهگیری پرتو مثال‌های خوبی هستند که احتمالا از دوبرابر شدن جریان‌های داده‌ای در FP32 سود می‌برند.

دوبرابر کردن جریان خروجی محاسبه در پردازنده، نیازمند دوبرابر کردن مسیرهای داده‌ای بود که از آن‌ها پشتیبانی می‌کردند. به‌همین دلیل در Ampere SM شاهد دوبرابر شدن حافظه‌ی اشتراکی و عملکرد کش L1 در SM هستیم. در SM امپر شاهد ۱۲۸ بایت در هر کلاک هستیم که در تورینگ، ۶۴ بایت در هر کلاک بود. انویدیا، پهنای باند L1 برای GeForce RTX 3080 را ۲۱۹ گیگابایت‌برثانیه اعلام می‌کند که در مقایسه با ۱۱۶ گیگابایت‌برثانیه در GeForce RTX 2080 Super یک بهبود قابل‌توجه محسوب می‌شود.

تاماسی در ادامه‌ی صحبت‌هایش می‌گوید امپر هم مانند نسل‌های قبلی پردازنده‌های انویدیا، مجهز به GPC، TPC، SM و ROP است که درکنار کنترلرهای حافظه عمل می‌کنند. واحد GPC را می‌توان یک بلوک سخت‌افزاری سطح بالا با سلطه‌ی بیشتر دانست. تمامی واحدهای پردازشی گرافیکی کلیدی در داخل GPC قرار می‌گیرند. هر GPC شامل یک موتور اختصاصی Raster می‌شود که در طراحی جدید، دو پارتیشن ROP هم در آن قرار گرفته‌اند. هر پارتیشن، شامل هشت واحد ROP (مخفف Raster Operators) می‌شود. اضافه شدن ROP را می‌توان قابلیت جدید پردازنده‌های گرافیکی مبتنی بر معماری امپر در دسته‌ی GA10x دانست. تاماسی در پایان صحبت‌هایش می‌گوید که به‌زودی جزئیات بیشتر را در سند فنی انویدیا امپر منتشر خواهند کرد.

با نگاهی دقیق‌تر به واحد SM در امپر، متوجه وجود ۱۲۸ واحد FP32 در هر بلوک می‌شویم. یکی از دو مسیر داده‌ای FP32 می‌تواند به‌صورت هم‌زمان فرایندهای عملیاتی INT32 را هم انجام دهد. هزینه‌های تنسور شامل چهار واحد می‌شوند. چهار واحد بافت و یک هسته‌ی RT هم در هر SM دیده می‌شود.

یادگیری عمیق انویدیا امپر / Nvidia Ampere
هسته تنسور نسل سوم انویدیا امپر / Nvidia Ampere
رهگیری پرتو انویدیا امپر / Nvidia Ampere
بهبود رهگیری پرتو انویدیا امپر / Nvidia Ampere
بهبود موشن بلور در انویدیا امپر / Nvidia Ampere
موشن بلور
معرفی موشن بلور در انویدیا امپر / Nvidia Ampere
رندر صحنه موشن بلور انویدیا امپر / Nvidia Ampere
شتاب‌دهی سخت افزاری انویدیا امپر / Nvidia Ampere
معماری پاسکال انویدیا
هسته های اختصاصی RT در انویدیا امپر / Nvidia Ampere
هسته های اختصاصی RT انویدیا امپر
بهبود قدرت با هسته های اختصاصی RT
معماری انویدیا تورینگ
معماری سنتی انویدیا پاسکال
معماری انویدیا پاسکال در برابر تورینگ
انویدیا تورینگ در مقابل انویدیا امپر
معماری انویدیا امپر / Nvidia Ampere
معماری انویدیا امپر / Nvidia Ampere
RT حرفه ای در انویدیا امپر / Nvidia Ampere
چالش IO در نسل جدید بازی‌ها
بهبود عمیق عملکرد در انویدیا امپر / Nvidia Ampere
مشخصات ذخیره سازی انویدیا امپر / Nvidia Ampere
خواندن داده فشرده نشده در انویدیا امپر / Nvidia Ampere
IO قدیمی برای بازی ها اشکال ایجاد می کرد
خواندن داده های فشرده در معماری قدیمی گرافیکی
مشکل پردازنده در خواندن داده فشرده نشده
RTX IO
معرفی RTX IO
فشرده سازی به کمک NVMe
دمو انویدیا امپر / Nvidia Ampere
دموی سرعت بارگذاری انویدیا امپر / Nvidia Ampere

انویدیا برای هسته‌های نسل سومی تنسور، از همان معماری Smarsity استفاده می‌کند که در خانواده‌ی محصولات Ampere HPC هم استفاده شده بود. امپر از چهار هسته‌ی تنسور در هر SM بهره می‌برد که کمتر از هشت هسته‌ی موجود در هر SM در تورینگ است. ازطرفی آن‌ها نه‌تنها از طراحی نسل سوم بهره می‌برند، بلکه جریان‌های SM بزرگ‌تری هم دارند که موجب افزایش تعداد می‌شود. پردازنده‌های گرافیکی امپر توانایی اجرای ۱۲۸ فرایند عملیاتی FP16 FMA را در هر هسته‌ی تنسور دارند که از کل هسته‌های INT16 بهره می‌برد و با به‌کار گرفتن معماری Sparsity تا ۲۵۶ افزایش پیدا می‌کند. مجموع فرایندهای عملیاتی FP16 FMA به ۵۱۲ می‌رسد و با به‌کارگیری معماری مذکور، می‌توان آن را به ۱۰۲۴ رساند. اعداد مذکور، نشان‌دهنده‌ی بهبود دوبرابری نسبت به پردازنده‌های گرافیکی تورینگ هستند که به‌لطف طراحی به‌روز تنسور ممکن می‌شود.

فرایندهای بهبود بالا برای هسته‌های رهگیری پرتو هم رخ می‌دهد که در نسل دوم، دوبرابر تداخل پرتو را نسبت به معماری تورینگ در پی دارند. بیشتر بودن تعداد واحدهای SM همچنین باعث افزایش تعداد هسته‌های RT هم می‌شود که عملکرد کلی و شتاب‌دهی رهگیری پرتو را به‌میزان قابل‌توجهی در امپر افزایش می‌دهد. 

کپی لینک

حافظه‌ی GDDR6X، تکامل بعدی در دنیای گرافیک

حافظه‌های Micron GDDR6X دستاوردهای مهمی در کارت‌های گرافیکی جدید دارند. این حافظه‌ها سریع‌تر هستند و درکنار دوبرابر کردن نرخ داده‌ی I/O، برای اولین‌بار از سیگنال‌دهی PAM4 چندسطحی در قالب‌های حافظه بهره می‌برند. حافظه‌های مذکور در کلاس محصولات انویدیا RTX 3090 به پهنای باند تا یک ترابایت می‌رسند که برای اجرای بازی‌های حرفه‌ای نسل بعد در رزولوشن 8K عالی خواهند بود.

 حافظه گرافیکی GDDR6X
کپی لینک

مشخصات و قابلیت‌های GDDR6X SGRAM جدید

  • نرخ داده‌ی SGRAM در حافظه‌های جدید نسبت به نسل قبلی دوبرابر می‌شود که در هر تراکنش، توان کمتری هم مصرف می‌کنند و از مرز یک ترابایت‌برثانیه در پهنای باند حافظه‌ی سیستمی فراتر می‌روند.
  • این حافظه‌ها، اولین دستگاه‌های حافظه‌ای اختصاصی گرافیک محسوب می‌شوند کع از سیگنال‌دهی رمزنگاری شده‌ی PAM4 بین پردازنده و DRAM بهره می‌برند. در سیستم جدید، از چهار سطح ولتاژ برای رمزنگاری و جابه‌جایی دو بیت از داده در هر کلاک رابط استفاده می‌شود.
  • حافظه‌های جدید را می‌توان در سرعت‌های بسیار بالا با پایداری مناسب طراحی کرد و به کار انداخت. امکان تولید انبوه آن‌ها نیز اکنون فراهم شده است.

همان‌طور که گفته شد، GDDR6X از سیگنال‌دهی چندسطحی PAM4 جدید استفاده کرده که سرعت انتقال داده را بسیار سریع‌تر می‌کند. همچنین نرخ I/O نیز بهبود پیدا می‌کند و ظرفیت هر قالب حافظه در آن از ۶۴ به ۸۴ گیگابیت‌برثانیه می‌رسد. قالب‌‌های حافظه‌ی Micron GDDR6x همچنین تنها DRAMهای مخصوص گرافیک هستند که می‌توان با وجود بهره‌گیری از PAM4 آن‌ها را به‌صورت انبوه تولید کرد.

قالب حافظه micron gddr6x

نکته‌ی جذاب درباره‌ی حافظه‌های GDDR6X اینکه می‌توان سرعت آن‌ها را تا ۲۱ گیگابیت‌برثانیه افزایش داد. البته در RTX 3090 شاهد حداکثر سرعت ۱۹/۵ گیگابیت‌برثانیه در آن‌ها هستیم. ظاهرا تولیدکننده‌ها می‌توانند قالب‌هایی با ظرفیت بیشتر را هم از مایکرون خریداری کنند. مایکرون همچنین تأیید می‌کند که برنامه‌هایی برای افزایش سرعت حافظه‌ها تا بیش از ۲۱ گیگابیت‌برثانیه در سال ۲۰۲۱ داد، اما هنوز مشخص نیست که چه کارت‌هایی از این حافظه‌ها بهره خواهند برد.

حافظه‌های مایکرون GDDR6X نه‌تنها سرعت بیشتر، بلکه پهنای باند بیشتری را هم با ۱۵ درصد توان مصرفی کمتر نسبت به نسل قبل ارائه می‌کنند.

کپی لینک

مشخصات حافظه‌های GDDR6X در مقایسه با نسل‌های قبل

نام حافظه

GDDR5

GDDR5X

GDDR6

GDDR6X

 چگالی

از ۵۱۲ مگابایت تا هشت گیگابایت

هشت گیگابایت

هشت گیگابایت و ۱۶ گیگابایت

هشت گیگابایت و ۱۶ گیگابایت

VDD و VDDQ

۱/۵ یا ۱/۳۵ ولت

۱/۳۵ ولت

۱/۳۵ یا ۱/۲۵ ولت

۱/۳۵ یا ۱/۲۵ ولت

VPP

نامشخص

۱/۸ ولت

۱/۸ ولت

۱/۸ ولت

نرخ داده

تا هشت‌ گیگابیت‌برثانیه

تا ۱۲ گیگابیت‌برثانیه

تا ۱۶ گیگابیت‌برثانیه

۱۹ و ۲۱ و بیشتر از ۲۱ گیگابیت‌برثانیه

تعداد کانال

۱

۱

۲

۲

Access granularity

۳۲ بایت

۶۴ بایت - ۲ عدد ۳۲ بایتی در حالت pseuso 32B

دو کانال ۳۲ بایتی

دو کانال ۳۲ بایتی

Burst length

۸

۱۶ یا ۸

۱۶

۸ در حالت PAM4 و ۱۶ در حالت RDQS

سیگنال‌دهی

POD15/POD135

POD135

POD135/POD125

PAM4 POD135/POD125

پکیج

BGA-170

14x12x0.8mm ball pitch

BGA-190

14x12x0.65mm ball pitch

BGA-180

14x12x0.75mm ball pitch

BGA-180

14x12x0.75mm ball pitch

عرض I/O

x32/x16

x32/x16

دو کانال x16/x8

دو کانال x16/x8

تعداد سیگنال

61

- 40 DQ, DBI, EDC

- 15 CA

- 6 CK, WCK

61

- 40 DQ, DBI, EDC

- 15 CA

- 6 CK, WCK

70 یا 74

- 40 DQ, DBI, EDC

- 24 CA

- 6 or 10 CK, WCK

70 یا 74

- 40 DQ, DBI, EDC

- 24 CA

- 6 or 10 CK, WCK

PLL, DCC

PLL

PLL

PLL,DCC

DCC

CRC

CRC-8

CRC-8

دو عدد CRC-8

دو عدد CRC-8

VREFD

در هر دو بایت، داخلی یا خارجی

داخلی در هر بایت

داخلی در هر پین

داخلی در هر پین، سه گیرنده‌ی زیرمجموعه در هر پین

Equalization

نامشخص

RX/TX

RX/TX

RX/TX

VREFC

خارجی

خارجی یا داخلی

خارجی یا داخلی

خارجی یا داخلی

خود نوسازی یا SRF

بله، SRF موقتی کنترل‌شده

بله، SRF موقتی کنترل‌شده و SRF هایبرنیت

بله، SRF موقتی کنترل‌شده و SRF هایبرنیت

VDDQ-off

بله، SRF موقتی کنترل‌شده و SRF هایبرنیت

VDDQ-off

اسکن

SEN

IEEE 1149.1 JTAG

IEEE 1149.1 JTAG

IEEE 1149.1 JTAG

کپی لینک

طراحی سیستم خنک‌کننده در GeForce RTX 30

انویدیا یکی از بهترین طراحی‌های سیستم گرمایی Founders Edition را در کارت‌های گرافیکی RTX 30 پیاده‌سازی کرده است. تیم سبز می‌گوید عملکرد بهتر و سریع‌تر کارت‌های گرافیکی جدید، نیازمند راهکارهای خنک‌کننده‌ی بهتر بود و به همین دلیل، آن‌ها راهکاری مخصوص را برای نسل بعدی کارت‌های گرافیکی خود به‌کار گرفته‌اند. این راهکارهای جدید، پردازنده‌ی گرافیکی را در دمای پایین نگه می‌دارند و با پیاده‌سازی فناوری‌های متعدد موجود و تعدادی فناوری جدید، جلوی افزایش بیش‌ازحد صدای عملیاتی را هم می‌گیرند.

سیستم خنک‌کننده‌ی جدید فاندرز ادیشن از یک هیت‌سینک مخصوص با آلیاژ آلومینیم استفاده می‌‌کند که با بهره‌مندی از محفظه‌ی بخار و فن‌های مبتنی بر فناوری محوری دوسویه، عملکردی عالی دارد. هیت‌سینک خنک‌کننده از یک پوشش نانوکربن بهره می‌برد که قطعا در کنترل کردن دما موفق خواهد بود.

سیستم خنک کننده در RTX 30

طراحی سیستم خنک‌کننده‌ی جدید در RTX 30 بسیار منحصربه‌فرد به‌نظر می‌رسد. این اولین طراحی در نوع خود محسوب می‌شود که آخرین بار نمونه‌ای مشابه با آن را در GTX 780 با هیت‌سینکی بزرگ دیده بودیم.

در طراحی سیستم خنک‌کننده‌ی جدید، موقعیت‌های خاصی برای قرارگیری فن دیده می‌شود که یکی در جلو و دیگری در پشت کارت قرار می‌گیرد. این پیکربندی کشش و مکش که با ترکیب فن دوگانه ایجاد می‌شود، گرما را با عملکردی ساده‌تر و بهینه‌تر از خروجی بخار کارت گرافیک استخراج می‌کند. البته کمی هوا به داخل کیس انتقال داده می‌شود که باتوجه‌به قدرت و کیفیت بالای سیستم‌های خنک‌کننده‌ی کنونی و بهره‌مندی از خنک‌کننده‌های مایع، مشکل زیادی ایجاد نخواهد کرد.

جریان هوا در سیستم خنک کننده RTX 30
سیستم خنک کننده RTX 30
جریان هوا کیس
نمودار سیستم خنک کننده RTX 3080
سیستم خنک کننده RTX 30 در مقایسه با RTX 2080
نمایی از RTX 30 در کیس
جریان سیستم خنک کننده RTX 30
جریان هوا در RTX 30

انویدیا تأکید می‌کند که طراحی جدید فاندرز ادیشن صدای کمتری نسبت به خنک‌کننده‌های سنتی دومحوره دارد و همچنین عملکردی دوبرابر بهتر از آن‌ها را ارائه می‌کند. تغییر در طراحی مصرف توان و خصوصا NVLink نقش مهمی در بهبود عملکرد سیستم خنک‌کننده داشته است. تغییرات جدید، جریان بهتر هوا را در از میان بزرگ‌ترین مجموعه‌ی فین طراحی‌شده تا به امروز، آسان‌تر می‌کند. منافذ براکتی بزرگ‌تر در ساختار خنک‌کننده در ترکیب با فین‌های خاص، جریان بزرگ‌تری از هوا را ممکن می‌کنند. از هر جهت که نگاه کنید، طراحی فاندرز ادیشن با تمرکز بر افزایش جریان هوا انجام شده است. به حداقل رساندن دما و رسیدن به بالاترین سطح عملکرد با کمترین صدا، همگی در طراحی جدید لحاظ شده‌اند.

بهبود عملکرد در توان مصرفی خنک کننده RTX 30

کارت گرافیک RTX 3080 در مبحث صدای خنک‌کننده و عملکرد، در حداکثر دمای ۷۸ درجه‌ی سانتی‌گراد عمل می‌کند. کارت گرافیک مذکور برای رسیدن به حداکثر باید به توان ۳۲۰ وات برسد که در آن حالت، خروجی صدای ۳۰ دسی‌بل خواهد داشت. در مقام مقایسه، کارت گرافیک تورینگ فاندر ادیشن حداکثر دمای ۸۱ درجه‌ی سانتی‌گراد داشت و حداکثر صدای آن نیز با توان ۲۴۰ وات، ۳۲ دسی‌بل گزارش می‌شد (کارت گرافیک RTX 2080 Super).

بهبود ۱/۹ برابری عملکرد در توان مصرفی خنک کننده RTX 30

در آزمایش‌های اختصاصی تیم سبز،  RTX 3080 فرکانس میانگین ۱۹۲۰ مگاهرتز را با توان مصرفی ۳۱۰ وات ثبت می‌کند که حداکثر دمای آن را به ۷۶ درجه می‌رساند. انویدیا در همین مقایسه، فاکتور ۱/۹ برابر را مطرح کرده و ادعا می‌کند که RTX 3080 با صدا و دمای کمتر امکان ارائه‌ی خروجی ۱۰۰ فریم‌برثانیه را دارد که در مقایسه با ۶۰ فریم‌برثانیه‌ی نسل قبلی، یک پیشرفت محسوب می‌شود.

کپی لینک

طراحی برد PCB و توان RTX 3080 و RTX 3090

یکی از تغییرهای عمده‌ای که در کارت گرافیک RTX 3090 Founders Edition دیده می‌شود، در طراحی PCB نهفته است. کارت‌های گرافیکی RTX 3080 و RTX 3090 با پکیجینگ منحصربه‌فرد و کامپکت PCB طراحی و ساخته می‌شوند که قبلا در فضای مصرف‌کننده در هیچ‌جا دیده نشده بود. ازطرفی کامپکت بودن طراحی بدین معنی نیست که کارت‌ها توان مصرفی زیای ندارند. انویدیا در همین کارت‌های کامپکت مجموعه‌ای با توان طراحی بسیار بالا قرار داده است.

طراحی PCB در RTX 30

برد PCB در کارت‌های جدید انویدیا شامل ۲۰ بخش مصرف‌کننده‌ی توان می‌شود که طراحی خاص و حرفه‌ای آن را در مقایسه با کارت‌های RTX 20 پرچم‌دار نشان می‌دهد. پردازنده‌ی گرافیکی توان مورد نیاز خود را از ۱۸ فاز دریافت می‌کند و توان حافظه نیز از دو فاز دیگر تأمین می‌شود. انویدیا می‌گوید این نوع از PCB یک محصول عالی برای اورکلاک محسوب می‌شود که کاربران با استفاده از آن، به توان‌های بسیار بالاتری خواهند رسید. البته PCB در نسخه‌ی فاندرز ادیشن با نسخه‌‌ی عادی تفاوت دارد و در نسخه‌های مرسوم، از همان طراحی چهارگوش استفاده می‌شود.

طراحی جدید PCB در RTX 30

کارت‌های گرافیکی RTX 30 مدل فاندرز ادیشن علاوه بر طراحی جدید، از کانکتورهای برق ۱۲ پینی Micro-Fit 3.0 بهره می‌برند. این کانکتورها نیازی به ارتقا منبع تغذیه ایجاد نمی‌کنند چون با رابط‌های 2x8pin به 1x12pin عرضه می‌شوند و می‌توان بدون مشکل تأمین توان، از آن‌ها بهره برد.

جانمایی کانکتورهای ۱۲ پینی روی PCB در کارت‌های جدید انویدیا یک نوآوری دیگر را از تیم سبز نشان می‌دهد. پین‌ها به‌صورت عمودی جانمایی شده‌اند و باتوجه‌به طراحی PCB، می‌توان دلیل استفاده از طراحی ۱۲ پینی را به‌جای طراحی استاندارد هشت پینی استاندارد متوجه شد. در PCB فضای محدودی برای انجام فرایندهای این‌چنینی وجود دارد و باید از ورودی توان کوچک‌تر استفاده می‌شد.

کپی لینک

عملکرد، زمان عرضه و قیمت RTX 30

انویدیا در اطلاعات تکمیلی خود جزئیاتی از اعداد و ارقام توان در کارت‌های گرافیکی جدید منتشر کرد. در نمودارهای زیر، توان و عملکرد کارت‌های RTX 3070 و RTX 3080 و RTX 3090 v را مشاهده می‌کنید.

قدرت و عملکرد RTX 30

انویدیا هنوز هیچ آمار و ارقام دقیقی درباره‌ی کارت‌های جدید سری RTX 30 منتشر نکرده است، اما باتوجه‌به همین رونمایی کلی هم می‌توان پیش‌بینی کرد که RTX 3070 عملکردی بالاتر از RTX 2080 Ti دارد و RTX 3080 بسیار بهتر از RTX 2080 Ti خواهد بود. کارت گرافیک پرچم‌دار RTX 3090 هم که سرعتی تقریبا ۵۰ درصد بهتر از RTX 2080 Ti دارد و بهبودی عالی را در مجموعه‌ی خانواده‌ی جدید نشان می‌دهد.

BFGPU در RTX 30
عملکرد RTX 3070
عملکرد RTX 3080
کارت گرافیک Nvidia GeForce RTX 3090 از نمای بالا

درواقع انویدیا پیش‌نمایشی کلی را از عملکرد و قدرت کارت‌های جدید به نمایش گذاشت. آن‌ها پیش‌نمایشی از Doom Eternal را با RTX 3080 نمایش دادند که بسیار بهتر از RTX 2080 Ti ظاهر شد و همچنین توانایی عالی کارت در اجرای بازی‌های 4K هم به نمایش گذاشته شد. در اکثر بازی‌‌های AAA، کارت‌های جدید انویدیا توانایی رسیدن به حداکثر نرخ فریم ۶۰ فریم‌برثانیه را دارند.

بازی های جدید پشتیبانی RTX
بازی های RTX جدید
فورت نایت با RTX
DLSS جدید در فورت نایت
بازی های RTX جدید در چین
DLSS 2.0 در فورت نایت
DLSS 2.0 در مقایسه به DLSS 1.0
3Dmark با پشتیبانی از RTX جدید
DLSS 2.0 مقایسه با DLSS 1.0
RTX 3090 کیفیت 8K
مشکلات بازی 8K
8K DLSS در RTX 30
HDMI 2.1 در RTX30
Nvidia DLSS 8K
RTX 30 مخصوص بازی 8K
AV1 Decoder در RTX 30

درنهایت نوبت به اطلاعات قیمت و زمان عرضه‌ی کارت‌های جدید انویدیا می‌رسد. تیم سبز می‌گوید RTX 3080 اول از همه و در تاریخ ۱۷ سپتامبر به بازار عرضه می‌شود. پس از آن نوبت RTX 3090 خواهد بود که ۲۴ سپتامبر به بازار می‌آید و درنهایت RTX 3070 در ماه اکتبر به مصرف‌کننده‌ها عرضه می‌شود. ازلحاظ قیمت نیز کارت‌ها به‌ترتیب ۱،۴۹۹ و ۶۹۹ و ۴۹۹ دلار قیمت خواهند داشت. به‌زودی نسخه‌های سفارشی و پرمیوم نیز با قیمت‌های متنوع معرفی می‌شوند.

مقاله رو دوست داشتی؟
نظرت چیه؟
داغ‌ترین مطالب روز
تبلیغات

نظرات