معماری گرافیکی Nvidia Ada Lovelace معرفی شد؛ لیتوگرافی ۴ نانومتری و ۷۶ میلیارد ترانزیستور
انویدیا همانطور که پیشتر وعده داده بود، معماری گرافیکی جدید Ada Lovelace را در جریان برگزاری رویداد GTC 2022 معرفی کرد. این معماری به تولید تراشههایی چهار نانومتری با ۷۶ میلیارد ترانزیستور ختم میشود، تراشههایی که قلب تپندهی گرافیکهای سری RTX 4000 خواهند بود. Ada Lovelace سومین نسل از معماریهای گرافیکی خانوادهی RTX است.
به روایت انویدیا، Ada Lovelace یک «جهش نسلی عظیم» در عملکرد، بهرهوری و تواناییهای گرافیکهای تیم سبز اعمال میکند. براساس گفتهی انویدیا، Ada Lovelace پیشرفتهترین معماری گرافیکی تاریخ است.
جنسون هوانگ، مدیرعامل انویدیا، در جریان برگزاری رویداد GTC اعلام کرد تراشههای مبتنیبر معماری Ada Lovelace شامل حداکثر ۱۸٬۰۰۰ هستهی CUDA خواهند بود. تعداد هستههای CUDA در نسل جدید معماری گرافیکی انویدیا بیش از ۷۰ درصد بیشتر از معماری Ampere است. کارتهای گرافیک سری RTX 3000 بر پایهی معماری Ampere تولید شده بودند.
گرافیکهای مبتنیبر معماری Ada Lovelace در مصرف انرژی همسطح با Ampere تا دو برابر قدرت بیشتر ارائه میدهند. در نسل جدید گرافیکهای انویدیا، دست گیمر برای اورکلاک بازتر است. براساس اعلام انویدیا، معماری گرافیکی Ada Lovelace شامل پردازندهای جریانی با قدرت ۹۰ ترافلاپس است و به تولید تراشههایی با لیتوگرافی سفارشی چهار نانومتری شرکت تایوانی TSMC منتهی میشود.
تعداد هستههای CUDA در گرافیکهای مبتنیبر Ada Lovelace بیش از ۷۰ درصد بیشتر میشود
پردازندههای جریانی (موسوم به SM) بخش زیادی از قدرت گرافیکی موردنیاز برای بازی را ارائه میدهند. در نسل قبل قدرت این پردازندهها دو برابر بیشتر شد و در معماری Ada Lovelace قدرت آنها بیش از دو برابرِ دیگر افزایش یافته است. قویترین تراشهی گرافیکی Ada Lovelace میزبان ۷۶ میلیارد ترانزیستور خواهد بود، این در حالی است که تعداد ترانزیستورها در نسل قبل به ۲۸ میلیارد میرسید.
انویدیا از حضور تکنیک سایهزنی Shader Execution Reordering (یا SER) در معماری جدیدش خبر میدهد. این تکنیک عملکرد رهگیری پرتو (Ray Tracing) کارت گرافیک را دو تا سه برابر تقویت میکند.
معماری پردازندههای گرافیکی تا حد زیادی بر پردازشهای موازی اتکا میکند و هرچه تعداد پردازشهای همزمان افزایش یابد، بهینهتر میشود. SER انویدیا به شکل قابل توجهی روی پردازشهای موازی اثر میگذارد و سه پردازش پیشین را بهینهتر میکند. بهلطف SER عملکرد سایهزنی کارتهای گرافیک دو برابر و نرخ فریم داخل بازیها تا حداکثر ۲۵ درصد بهتر خواهد شد.
انویدیا با رونمایی هستههای ویژهای تحت عنوان RT Core، رؤیای استفاده از تکنیک رهگیری پرتو در بازیهای ویدیویی را به واقعیت تبدیل کرد و امسال در معماری Lovelace از نسل سوم این هستهها استفاده کرده است. انویدیا میگوید هستههای نسل سوم درمقایسهبا نسل قبل تا ۲٫۸ برابر بهتر عمل میکنند. این هستههای جدید مجهز به موتور Opacity Micro-Map و موتور Micro-Mesh هستند تا پردازشهای رهگیری پرتو را بهتر انجام دهند.
انویدیا میگوید Ada Lovelace بهرهوری هستههای CUDA را دو برابر بیشتر میکند و شامل چهارمین نسل از هستههای تنسور است. به گفتهی تیم سبز در فرمت FP16 قدرت ۱٬۴۰۰ تنسور ترافلاپس ارائه خواهد شد. هستههای تنسور انویدیا روی پردازشهای هوش مصنوعی متمرکزند و مزایایی برای تماسهای صوتی و ویدیویی نیز به همراه میآورند. انویدیا میگوید هستههای نسل چهارمی تنسور مجهز به موتور FP8 جدیدی هستند که توان عملیاتی را تا پنج برابر افزایش میدهد.
انویدیا میگوید فرکانس گرافیکهای Ada Lovelace را در آزمایشگاههایش به بیش از ۳٫۰ گیگاهرتز اورکلاک کرده است
انویدیا میگوید فرکانس گرافیکهای Ada Lovelace را در آزمایشگاههایش به بیش از ۳٫۰ گیگاهرتز اورکلاک کرده است. احتمالاً تعداد کمی از گرافیکهای جدید انویدیا میتوانند چنین فرکانسی ارائه دهند، اما اکثر گرافیکهای RTX 4000 فرکانس بالای ۲٫۰ گیگاهرتز را بهسادگی ارائه خواهند داد. همین افزایش فرکانس نشان میدهد عملکرد RTX 4000 نسبتبه نسل قبل ۵۰ درصد بهبود پیدا کرده است.
انویدیا میگوید کارتهای گرافیک سری RTX 4000 که بر پایهی سومین نسل از معماریهای مختصبه محصولات RTX تولید میشوند بسیار پرقدرت خواهند بود و بهبودهای قابل توجهی در عملکرد گیمینگ و پردازشهای هوش مصنوعی بههمراه خواهند آورد. بهلطف معماری جدید Ada Lovelace توسعهدهندگان میتوانند در بازیهایی که بهطور کامل بر رهگیری پرتو متکی هستند عملکرد را تا چهار برابر بهبود دهند.
انویدیا در مراسم امروز از قابلیت DLSS 3 هم رونمایی کرد. تیم سبز میگوید الگوریتم این فناوری را در نسل جدید تغییر داده است تا عملکرد بهبود یابد و جلوههای بصری بهشکل جذابتری نمایش داده شوند. انویدیا در مراسم خود بازی Cypberpunk 2077 را با فناوری DLSS 3 به نمایش گذاشت تا نشان دهد روشن شدن این قابلیت چقدر روی نرخ فریم بازی اثر میگذارد.
انویدیا میگوید DLSS 3 انقلابی در رندرینگ عصبی محسوب میشود و با اتکا Optical Flow Accelerator نرخ فریم را به شکل قابل توجهی بالا میبرد. از طرفی RTX Remix به توسعهدهندگان امکان میدهد مادهایی شگفتانگیز با رهگیری پرتو و DLSS برای بازیهای کلاسیک بسازند.
انویدیا در معماری Lovelace شماری از قابلیتهای فعلی را نیز بهبود داده است. به گفتهی تیم سبز، Nvidia Reflex باعث میشود بازیهای ویدیویی واکنشگراتر از قبل شوند و در بازیهای محبوب ژانر ورزش الکترونیکی تأخیر سیستم به ۱۰ میلیثانیه کاهش یابد.
بهعلاوه GeForce Experience اکنون میتواند در حالت HDR گیمپلی بازیها را با وضوح 8K و نرخ ۶۰ فریمبرثانیه ضبط کند. نسخهی جدید Nvidia Broadcast دو برابر بهتر از نسخهی قبل نویز پسزمینه را از بین میبرد و دوربین را برای تماسهای ویدیویی و پخش زنده بهبود میدهد.
انویدیا در مراسم امشب از کارتهای گرافیک ردهبالای RTX 4090 و RTX 4080 بهعنوان اولین GPUهای مبتنیبر معماری Lovelace پردهبرداری کرد. کارت گرافیک RTX 4090 از ۱۶٬۳۸۴ هستهی CUDA و سرعت کلاک بوست ۲٫۵۲ گیگاهرتز و ۲۴ گیگابایت حافظهی GDDR6X استفاده میکند و با قیمت ۱٬۵۹۹ دلار عرضه میشود.
کارت گرافیک RTX 4080 در دو مدل با ۱۲ یا ۱۶ گیگابایت حافظهی GDDR6X معرفی شده است. مدل ۱۶ گیگابایتی ۹٬۷۲۸ هستهی CUDA دارد اما مدل ۱۲ گیگابایتی از ۷٬۶۸۰ هسته استفاده میکند. این دو مدل به ترتیب ۱٬۱۹۹ دلار و ۸۹۹ دلار قیمت دارند.