نگاهی جامع به کارت گرافیک GeForce GTX 1660 Ti؛ فرمانروای میانرده
کارت گرافیک GeForce GTX 1660 Ti عضو جدید خانوادهی انویدیاست که بر پایهی تراشهی TU116 با معماری تورینگ ساخته شده است. TU116 تراشهای کاملاً جدید است که از ویژگیهای معماری تورینگ نظیر شیدرهای بهبودیافته، معماری کش یکپارچه، پشتیبانی از سایهزنی تطبیقی (adaptive shading) و سازگاری کامل با ویژگیهای شتابدهی در رمزگذاری و رمزگشایی ویدئو برخوردار است. این پردازندهی گرافیکی درست مثل مدلهای سطح بالاتر سری RTX 20 به حافظهی GDDR6 مجهز شده است. اما این کارت گرافیک از هستههای RT برای رهگیری پرتو و هستههای Tensor برای اعمال قابلیتهای هوش مصنوعی، بهرهمند نیست. در نتیجه TU116 تراشهای با معماری تورینگ، اما ضعیفتر از تراشههای RTX است؛ با این وجود این تراشه با فهرستی از ویژگیها همراه است که تنها در کارتهای ردهبالای امروزی یافت میشود.
انویدیا به GeForce GTX 1660 Ti یک برچسب قیمت ۲۸۰ دلاری زده و میگوید این کارت قرار است بهطور کامل جایگزین کارت GeForce GTX 1060 6GB با معماری پاسکال شود. با اینکه این کارت گرافیک ۳۰ دلار (یا ۱۲ درصد) گرانتر از قیمت زمان عرضهی کارت GeForce GTX 1060 6GB روانه بازار شده؛ اما شرکت انویدیا مدعی است که پردازندهی گرافیکی جدیدش با توان طراحی حرارتی یکسان (۱۲۰ وات)، عملکردی تا ۱.۵ برابر سریعتر از GTX 1060 در بازیهای روز خواهد داشت.
باید اشاره کرد که کارت گرافیک GTX 1660 Ti نسخهی مرجعی ندارد و تمامی کارتهای این مدل توسط شرکای تجاری انویدیا ساخته میشوند. لذا نباید انتظار بازاری شستهرفته و قیمتگذاری یکدست را در تمامی برندها داشت و قیمتها بستگی به میزان امکانات، طراحی برد و سیستم خنککنندهی کارت، کیفیتِ تغذیهی پردازنده و پارامترهایی از این دست دارد. تابهحال مدلهایی از GTX 1660 Ti توسط قطعهسازان معروف نظیر ASUS، MSI و EVGA روانهی بازار شده است.
ما تاکنون در نسلِ جدید کارتهای تورینگ، بهبود عملکرد چندانی به ازای هر دلار پرداختی مشتریان نسبت به کارتهای پاسکال ندیدهایم و برای این کارت جدید باید دید که شرکت انویدیا در این رویه چه تغییری خواهد داد.
شرکت انویدیا تاکنون چهار تراشهی گرافیکی جداگانه را با معماری نوین معرفی و روانهی بازار کرده است. تراشهی TU116 کارت GTX 1660 Ti نسبت به تراشههای قبلی تورینگ منابع کمتری به همراه دارد و لذا ردهی قیمت پایینتری را نیز نشانه رفته است. با این وجود انویدیا سعی دارد توازن را در کارتهای جدیدش بر هم نزند و با کاهش منابع، در روند پردازش حداکثری و بهینهی پردازندههای گرافیکی سطح پایینتر تورینگ خود گلویی و تنگنا ایجاد نکند.
انویدیا تراشهی TU116 را بهعنوان یک مرز در نظر گرفته است؛ جایی که در آن توان سایهزنی بهاندازهی کافی افت کرده تا مانع از آن شود که قابلیتهای آیندهنگر معماری تورینگ نظیر رهگیری پرتو در حاشیه قرار گیرد و به هدف مطلوب خود دست پیدا نکند. با کنار گذاشتن هستههای RT و Tensor در این پردازندهی گرافیکی، تراشهای به ابعاد ۲۸۴ میلیمترمربع متشکل از ۶.۶ میلیارد ترانزیستور، با فناوری ساخت ۱۲ نانومتری شرکت تایوانی TSMC و استفاده از ترانزیستورهای FinFET ساخته شده است. باوجود استفاده از ترانزیستورهای کوچکتر، تراشهی TU116 انویدیا ۴۲ درصد بزرگتر از GP106 (تراشهی کارت GTX 1060) است که قرار است جایگزینی برای آن باشد.
بخشی از این ابعاد بزرگتر ناشی از واحدهای سایهزن پیچیدهتر در معماری تورینگ است. به مانند کارتهای ردهبالای سری GeForce RTX 20، کارت GeForce GTX 1660 Ti نیز از اجرای همزمان دستورالعملهای محاسباتی FP32 (که بیشترین بارکاری را به واحدهای سایهزن اعمال میکند) و فرامین INT32 (برای دادههای آدرسدهی و واکشی، بیشینه و کمینهی ممیز اعشاری، مقایسه و...) پشتیبانی میکند. زمانیکه حرف از عملکرد بهتر هستههای تورینگ نسبت به معماری پاسکال در یک سرعت کلاک معین میشود، علت اصلی مواردی است که گفته شد.
Streaming MultiProcessorها یا واحدهای SM در معماری تورینگ متشکل از تعداد هستههای CUDA کمتری نسبت به معماری پاسکال است؛ اما بنا به روش طراحی، اثر این کاهش تعداد هستههای محاسبهگر با افزایش تعداد واحدهای SM در سطح تراشه جبران شده است. در معماری جدید به هر دستهی ۱۶ تایی از هستههای CUDA یک Scheduler (دوبرابر معماری پاسکال) و یک واحد Dispatch (شبیه معماری پاسکال) تخصیص داده میشود. هر گروه چهارتایی از این دستههای ۱۶ هستهای همراه با ۹۶ کیلوبایت حافظهی کش و چهار واحد بافت نگاشت تشکیل یک SM (یا Streaming MultiProcessor) را میدهد. باتوجهبه دو برابر شدن Schedulerها در معماری جدید، تنها صادر شدن یک دستورالعمل از سوی هر Scheduler در هر سیکل کلاک برای هر هسته ی CUDA کفایت کرده و همزمان آن Scheduler دستورالعمل متفاوت دیگری را به یک واحد دیگر شامل هستههای INT32 صادر میکند.
انویدیا میگوید که بهجای هستههای Tensor، تعداد ۱۲۸ هستهی FP16 بهازای هر SM در تراشهی TU116 جایگذاری کرده است؛ با این عمل امکان پردازش فرامین با نیمی از دقت (FP16) با سرعت ۲ برابر محاسبات FP32 (دقت واحد) فراهم میشود؛ بااینحال سایر پردازندههای گرافیکی مبتنی بر تورینگ هم مدعی سرعت دو برابر در اجرای پردازشهای FP16 هستند و مشخص نیست که چرا GeForce GTX 1660 Ti در این زمینه، در میان آنها منحصربهفرد است. در نمودار زیر دیده میشود که کارت GeForce GTX 1660 Ti در پردازشهای FP16 نرمافزار SiSoftware Sandra v.28.49، نسبت به GTX 1060 پیشرفت بسیار چشمگیری داشته است.
تراشهی Tu116 از الگوریتمهایی با عنوان سایهزنی تطبیقی (Adaptive Shading) و همچنین قابلیتهای تسریعشدهی رمزنگاری و رمزگشایی ویدئو به مانند کارتهای ردهبالاتر RTX پشتیبانی میکند.
انویدیا ۲۴ واحد SM را در تراشه TU116 جایگذاری کرده و آنها را به سه کلاسترِ پردازش گرافیکی تقسیمبندی کرده است. با وجود ۶۴ هسته FP32 به ازای هر SM، در مجموع ۱۵۳۶ هستهی CUDA و ۹۶ واحد بافت نگاشت در کل سطح تراشه توزیع شدهاند. شرکای انویدیا بهطور قطع بازهای از فرکانسهای اضافی را برای پر کردن شکاف سرعت میان دو کارت گرافیک GTX 1660 Ti و RTX 2060 در نظر خواهند گرفت. با این وجود سرعت کلاک پایهی رسمی تراشهی TU116 معادل ۱۵۰۰ مگاهرتز و کلاک بوست در مشخصات این کارت ۱۷۷۰ مگاهرتز عنوان شده است. روی کاغذ سرعت انجام محاسبات FP32 توسط این کارت بالغ بر ۵.۴ ترافلاپس و سرعت انجام محاسبات FP16 بالغ بر ۱۰.۹ ترافلاپس است.
۶ کنترلر حافظهی GDDR6 که در طرفین تراشه قرار گرفتهاند، جمعاً پهنای باس ۱۹۲ بیت را برای این کارت فراهم آوردهاند و باتوجهبه سرعت انتقالِ دادهی ماژولهای حافظهی GDDR6 معادل 12Gbps (به عبارت دیگر ۱۲ گیگاترنسفر بر ثانیه)، حداکثر پهنای باند حافظه در مجموع بالغ بر ۲۸۸GBps خواهد بود. رقمی که در مقایسه با پهنای باند حافظهی GTX 1060 تا ۵۰٪ بیشتر است. چنین پهنای باند وسیعی به این کارت کمک خواهد کرد که برخلاف برادر بزرگترش، در رزولوشن 1440p و با آنتیالیاسینگ روشن، سطح عملکرد متناسبی را از خود به نمایش بگذارد.
کارت GTX 1660 Ti مانند GTX 1060 از ۶ گیگابایت حافظهی گرافیکی برخوردار است، اما پهنای باند حافظه در آن ۵۰ درصد بیشتر است
هر کنترلر حافظه با ۸ واحد خروجی رندر و ۲۵۶ کیلوبایت حافظهی کش سطح ۲ پیوند دارد. پس در مجموع تراشهی مورد بررسی ما ۴۸ واحد خروجی رندر و ۱.۵ مگابایت حافظه کش سطح ۲ دارد. تعداد واحدهای خروجی رندر در این کارت (در مجموع ۴۸ واحد) با تعداد این واحدها در کارت RTX 2060 یکسان است؛ اما ظرفیتِ برشهای حافظه L2 در این کارت نصفِ RTX 2060 است (RTX 2060 در مجموع ۳ مگابایت کش سطح ۲ دارد).
باوجود ابعاد بزرگتر تراشه، ۵۰ درصد تعداد ترانزیستور بیشتر و نرخ کلاک بوست بالاتر، توان طراحی حرارتی کارت گرافیک GTX 1660 Ti با کارت GTX 1060 برابر و معادل ۱۲۰ وات است. متاسفانه هیچ یک از این دو کارت از قابلیت GPU چندگانه پشتیبانی نمیکند، این در حالی است که تأکید انویدیا بر عملکرد بالاتر کارت با شیوهی اتصال SLI هنوز به قوت خود باقی است و راهی برای پیکربندی بهتر پردازندهی گرافیکی واحد در اختیار گیمرها نمیگذارد. در جدول زیر اطلاعات کاملتری از کارت Geforce GTX 1660 Ti در مقایسه با سایر کارتهای همرده درج شده است.
مشخصات | GeForce GTX 1660 Ti
| GeForce RTX 2060 FE | GeForce GTX 1060 FE | GeForce GTX 1070 FE |
---|---|---|---|---|
معماری | Turing | Turing | Pascal | Pascal |
تعداد هستههای CUDA | ۱۵۳۶ | ۱۹۲۰ | ۱۲۸۰ | ۱۹۲۰ |
توان محاسباتی FP32 (ترافلاپس) | ۵.۴ | ۶.۴۵ | ۴.۴ | ۶.۵ |
کلاک پایه پردازنده | ۱۵۰۰ | ۱۳۶۵ | ۱۵۰۶ | ۱۵۰۶ |
کلاک بوست پردازنده | ۱۷۷۰ | ۱۶۸۰ | ۱۷۰۸ | ۱۶۸۳ |
ظرفیت حافظه | ۶GB GDDR6 | ۶GB GDDR6 | ۶GB GDDR5 | ۸GB GDDR5 |
باس حافظه (بیت) | ۱۹۲ | ۱۹۲ | ۱۹۲ | ۲۵۶ |
پهنای باند حافظه (GB/s) | ۲۸۸ | ۳۳۶ | ۱۹۲ | ۲۵۶ |
تعداد واحدهای خروجی رندر | ۴۸ | ۴۸ | ۴۸ | ۶۴ |
تعداد واحدهای بافت نگاشت | ۹۶ | ۱۲۰ | ۸۰ | ۱۲۰ |
حافظه کش L2 | ۱.۵ | ۳ | ۱.۵ | ۲ |
توان طراحی حرارتی | ۱۲۰ | ۱۶۰ | ۱۲۰ | ۱۵۰ |
تعداد ترانزیستور (میلیارد) | ۶.۶ | ۱۰.۸ | ۴.۴ | ۷.۲ |
اندازه تراشه (میلیمترمربع) | ۲۸۴ | ۴۴۵ | ۲۰۰ | ۳۱۴ |
(دلار) | ۲۸۰ | ۳۵۰ | ۲۵۰ | ۴۵۰ |
سطح عملکرد:
کارشناسان PCGamer سطح عملکرد کارت GTX 1660 Ti محصول Asus را در بازیها و در رزولوشنهای مختلف آزمایش کردهاند. نتیجهی آزمایشهای این تیم در رزولوشن 1080p و با بالاترین جزئیات گرافیکی، در میانگین ۱۹ بازی بهروز و در تعدادی از بازیهای جدید بهطور جداگانه در گالری تصاویر زیر ارائه شده است.
نتایج عملکرد این کارت در رزولوشن 1440p و با حداکثر تنظیمات گرافیکی در مقایسه با کارتهای دیگر، در شکلهای زیر آمده است.
شاید بعضیها بگویند که کارت GTX 1660 Ti با قیمت ۲۷۹ دلاریاش کارتی برای رزولوشنهای بالاست؛ اما باید گفت که این کارت دقیقاً برای رزولوشن 1080p طراحی و در نظر گرفته شده است. باتوجهبه اینکه طبق آمار اکثر گیمرهای PC در رزولوشن 1080p دنیاهای گیمینگ را فتح میکنند، خبر خوب این است که کارت GTX 1660 Ti در این رزولوشن و در اکثر بازیها نرخ فریمی در حدود ۶۰ یا بیشتر از آن ارائه میدهد. همانطور که دیده میشود، متوسط نرخ فریم این کارت در مجموع ۱۹ بازی به روز ۸۶ فریم و کمینهی فریم ۶۲ است. پس میتوان برای این رزولوشن روی این کارت حساب خوبی باز کرد.
در بعضی عناوین جدیدتر مثل Anthem، عنوان جهانباز Assassin's Creed Odyssey و عنوان کاملاً جدید Metro Exodus کمی پای این کارت میلنگد و نمیتواند فریم خروجی ۶۰ را بهطور پایدار حفظ کند. در این رزولوشن عملکرد کارت مورد بررسی ما از کارت AMD RX 590 به خوبی پیشی گرفته و ۲۰ تا ۲۵ درصد عملکرد بهتری نسبت به آن دارد. این کارت که با GTX 1660 Ti از نظر قیمت در یک جایگاه ایستاده است، در اکثر عناوین عملکرد نازلتری داشته و در چند عنوان به سختی به GTX 1660 Ti نزدیک میشود.
شاید مهمترین نکته در بنچمارکهای GTX 1660 Ti میزان برتری آن نسبت به GTX 1060 6GB است؛ کارتی که رسماً قرار است به نفع برادر کوچکترش میدان را خالی کند. بهطور متوسط GTX 1660 Ti در عناوین مختلف حدود ۳۵٪ بهتر از GTX 1060 عمل کرده و حتی در برخی عناوین کارت GTX 1070 را نیز پشت سر میگذارد (گرچه در عناوین دیگر کارت GTX 1070 بهتر ظاهر میشود). پس اگر در حال حاضر صاحب یکی از کارتهای GTX 1070 انویدیا هستید، کارت GTX 1660 Ti گزینهی خوبی برای ارتقا به شمار نمیرود، اما اگر بین این دو کارت بخواهید یکی را انتخاب کنید، مسلماً کارت GTX 1660 Ti با تقریباً ۷۰ دلار قیمت پایینتر نسبت به قیمت فعلی کارت GTX 1070 (که تولید آن رو به توقف است) گزینهی مقرونبهصرفهتری است و البته معماری به روزتر و پشتیبانی بهتری دارد.
کارت گرافیک GTX 1660 Ti باتوجهبه عملکرد تا ۳۵٪ بهتر از GTX 1060، گزینهی ارتقای مناسبی برای آن به شمار میرود، اما باتوجهبه عملکرد تقریبا یکسان با GTX 1070 جایگزین مناسبی برای این کارت نخواهد بود
رزولوشن 1440p برای کارتهای میانرده زیر ۳۰۰ دلار کمی چالش برانگیز به نظر میرسد؛ در برخی عناوین مثل Battlefield 5 و Far Cry 5 عملکرد کارت تحت بررسی در این رزولوشن مطلوبتر و نرخ فریم خروجی بیشتر از ۶۰ است؛ اما در برخی عناوین که آمیخته با جلوههای گرافیکی سنگینتری هستند، مثل Assassin's Creed Odyssey یا Anthem یا عنوان جدید Metro Exodus که به راستی از سطح گرافیک کمنظیری برخوردار است، GTX 1660 Ti کمی در تنگنا قرار گرفته و به خوبی از عهدهی ایجاد یک خروجی فریم پایدار و مناسب گیمینگ برنمیآید و نرخ فریم بهطور متوسط به ۴۰ فریم بر ثانیه افت میکند.
در این رزولوشن هم کارت تازهوارد با ۲۵٪ عملکرد بهتر RX 590 رقیب را پشت سر گذاشته و در حدود ۲۵٪ بهتر از برادر بزرگتر خود GTX 1060 ظاهر شده است. عملکرد این کارت در این رزولوشن تا ۸۰ درصد بهتر از کارت GTX 970 انویدیاست و تقریبا تواناییهای یکسانی با GTX 1070 دارد. سرانجام چون کارت GTX 1660 Ti برای رزولوشن 4K طراحی نشده و در این رزولوشن عملکرد مطلوبی ندارد، از بررسی عملکرد آن در این کیفیت تصویر صرفنظر میکنیم. اگر بخواهیم نتایج عملکرد این کارت را برحسب قیمت آن در مقایسه با کارتهای دیگر بسنجیم، این کارت به نسبت پولی که برای آن پرداخت میشود (۲۸۰ دلار) ارزش خرید بالایی داشته و در جایگاه خوبی از این نظر قرار میگیرد. کارت GTX 1660 Ti گزینهی ارتقای خوبی برای کارتهایی مثل GTX 1060 و همچنین GTX 970 است؛ ولی همانطور که گفته شد جایگزین مناسبی برای GTX 1070 نخواهد بود.
بهعنوان نتیجهگیری کلی از مباحث فوق میتوان گفت که برای چیدن یک سیستم گیمینگ میانرده که قادر به ارائهی نرخ فریم مطلوب ۶۰ در رزولوشن 1080p و با تنظیمات گرافیکی بالا باشد، در این ردهی قیمت و در میان کارتهایی که اکثرا مربوطبه معماریهای یکی دو نسل قبل هستند، کارت بهتری نسبت به GTX 1660 Ti یافت نخواهد شد. گرچه بهعنوان تذکر باید افزود که اکثر عناوین گیم جدید، تقاضای فزایندهای از منابع سیستم دارند و میزان حافظهی گرافیکی مورد نیاز برای بازیهای جدید با تنظیمات حداکثری و بافت Ultra به سمت ۸ گیگابایت به پیش میرود. پس حتی با وجود داشتن این کارت، طی یکی دو سال آینده یا حتی زودتر باید آمادگی کاهش سطح تنظیمات بازی (بخصوص کیفیت بافت) را از Ultra به High داشته باشید و البته در خلال این سالها فکر خود را درگیر مزیتهای رهگیری پرتو و هوش مصنوعی کارتهای ردهبالاتر نکنید.