پلتفرم DRIVE AGX Orin انویدیا با ۱۲ هسته هرکول، ۱۷ میلیارد ترانزیستور دارد
انویدیا بهتازگی آخرین پلتفرم خود برای اتومبیلهای خودران با نام DRIVE AGX Orin را معرفی کرد. پلتفرم مذکور قدرت خود را مدیون پردازندهای از نوع SoC (سیستم روی تراشه) تحت نام Orin است. این تراشه از آخرین نسل معماری پردازندههای گرافیکی انویدیا برخوردار بوده و هستههای پردازشی آن، از نوع هرکول (Hercules) معماری ARM هستند. تعداد کثیری از ویژگیهای عملکردی مبتنیبر هوش مصنوعی نیز در این پردازنده گنجانده شده است. درواقع بازار هدف پلتفرم DRIVE AGX Orin، اتومبیلهای خودران و رباتها بوده و این سیستم محاسبهگر باید عملکرد بسیار بهتر و راندمان بالاتری نسبت به نسل پیشین خود، یعنی DRIVE Pegasus داشته باشد.
نسل بعدی از معماری گرافیکی انویدیا و هستههای پردازشی هرکول ARM، قدرت مورد نیاز برای تراشه Orin را تأمین میکنند
این پلتفرم که از پردازندهی نسل جدید Orin ساخته شده است، جایگزین پلتفرم Drive PX Pegasus خواهد شد. سیستم Drive PX Pegasus متشکل از چندین پردازندهی خاویِر (Xavier) و بر پایهی معماری تورینگ بوده و تا ۳۲۰ ترا عملیات (TOPs) را در توان ۵۰۰ واتی انجام میدهد. قرار است هر یک از هستههای پردازندهی Orin با رقم چشمگیر ۱۷ میلیارد ترانزیستور، ۲۰۰ ترا عملیات را در یک ثانیه انجام داده و ۷ برابر بازدهی بیشتری نسبت به SoCهای خاویِر داشته باشند. جهت مقایسه ذکر این نکته لازم است که بزرگترین کارتهای گرافیک ردهی مصرفکنندهی در حال ساخت، ولتا GV100 و تورینگ TU102، به ترتیب تنها ۲۱٫۱ و ۱۸٫۶ میلیارد ترانزیستور دارند.
انویدیا بهصورت خاصی، به نوع پردازندهی گرافیکی جدید در تراشهی Orin اشاره نکرده است، اما کارتهای گرافیک سری Ampere این تراشهساز از سال آینده روانهی بازار خواهند شد. لیتوگرافی ساخت در پردازندهی گرافیکی مذکور زیر ۱۲ نانومتر بوده و ارتقاء معماری در این محصول بزرگتر از چیزی است که در سیر تحولی ولتا به تورینگ شاهد بودیم. همچنین پردازندهی خاویِر اولین عضو از خانوادهی تراشههای انویدیا بود که تحت معماری گرافیکی ولتا معرفی شد. بنابراین جای تعجبی ندارد Orin که اولین تراشه با معماری Ampere است، جایگزین این محصول شود.
پردازندهی خاویِر در مجموع ۷ میلیارد ترانزیستور داشته و تحت لیتوگرافی ۱۶ نانومتری، از ۸ هستهی شخصیسازیشدهی ۶۴ بیتی با معماری ARM بهره میبرد. تعداد بیشتر ترانزیستورها در پردازندهی Orin نسبت به خاویر، این نکته را تأیید میکند که تراشهی یادشده نه با لیتوگرافی ۱۲ نانومتری، بلکه به لطف اشعهی ماوراء بنفش (EUV) تحت فرایند ۷ نانومتری تولید شده و درنتیجه تراکم ترانزیستورهای آن شدیدا بالا رفته است. همچنین شرکت ARM در نقشهی راه خود نشان داده که پردازندههای هرکول هم تحت لیتوگرافی ۷ نانومتری و هم با لیتوگرافی ۵ نانومتری میتوانند ساخته شوند. این نیز به نوبهی خود انعطاف لازم جهت تولید SoCهای Orin را در اختیار انویدیا قرار میدهد. همچنین گفته میشود هستههای نوعِ هرکول، ۱۰ درصد سرعت بیشتری نسبت به پردازندههای ۷ نانومتری Deimos دارند. جنسن هوانگ، مدیرعامل و بنیانگذار انویدیا در رابطه با پلتفرم DRIVE AGX Orin، گفته است:
ساخت وسیلهی نقلیهی خودران، شاید بزرگترین چالش پیش روی جامعهی محاسباتی است. میزان سرمایهگذاری مورد نیاز برای عرضهی وسایل نقلیهی خودران با سرعت بسیاری بالا رفته است و پیچیدگی کار نیازمند پلتفرمی قابل برنامهریزی، تعریفشده بهعنوان هوش مصنوعی و مقیاسپذیر همانند Orin است.
سام ابوالسمید، تحلیلگر مسائل تحقیقاتی ردهبالا در مؤسسهی Navigant Research نیز میگوید:
تعهد بلندمدت انویدیا به صنعت حملونقل همراهبا ابزار و پلتفرم مبتکرانه همزمان با توسعهی بیوقفه، منجر به [ایجاد] اکوسیستمی وسیع شده است. تقریبا هر شرکتی که در حال کار روی اتومبیل خودران است، برای سیستم محاسباتی خود از [تراشههای] انویدیا استفاده کرده است. بهنظر میرسد Orin گامی چشمگیر و رو به جلو باشد که میتواند کمک کند، فصل جدید و بزرگی در داستان این فناوری رو به رشد ایجاد شود.
در اسلایدی که حساب کاربری Dylan522P در توییتر منتشر کرده، چندین پیکربندی متفاوت از تراشهای با نام Orion در پلتفرم Drive فهرست شده است. بهنظر میرسد Orion چندین نوع بهینهشده در بار کاری و توان طراحی حرارتی داشته باشد که شامل نسخهی پایه با یک دوربین و قابلیت ۳۶ ترا عملیات در ثانیه در توان ۱۵ واتی، نسخهای با ۴ دوربین و قابلیت ۱۰۰ ترا عملیات در ثانیه در توان ۴۰ واتی، نسخهای با دو تراشه و قابلیت ۴۰۰ ترا عملیات در ثانیه در توان ۱۳۰ واتی و نسخهی پرچمدار با دو تراشهی Orion و دو کارت گرافیک مجزا و قابلیت ۲۰۰۰ ترا عملیات در ثانیه در توان ۷۵۰ واتی است. بهنظر میرسد توان طراحی حرارتی در نسخهای که دویست TOPs دارد، در حدود ۶۰ تا ۷۰ وات باشد.
یک پردازندهی گرافیکی نسل جدید نیز که به ظاهر فناوری مشابهی با پردازندهی Orion داشت، در رویداد GTC 2019 به نمایش گذاشته شد. پردازندهی گرافیکی یادشده، تا ۸۰۰ ترا عملیات (TOPs) را در توان ۳۱۰ واتی انجام میدهد. ارقام مذکور حاصل از این حقیقت است که دو عدد تراشه از پردازندهی Orion در توان طراحی حرارتی ۱۳۰ واتی، ۴۰۰ TOPs عملیات را انجام داده و بالاتر از پلتفرم DRIVE با توان ۶۲۰ واتی قرار میگیرند. توان طراحی حرارتی ۳۱۰ واتی در هر کارت گرافیک، این معنی را میدهد که این محصولات هنگام اجرای مجموعه دستورالعملهای Int8 (هشت بیتی)، ۸۰۰ ترا عملیات را در هر ثانیه انجام میدهند. در حال حاضر کارت گرافیک Quadro RTX 8000 که پرچمدار سری TU102 است، مجموعا ۲۰۶٫۱ TOPs عملیات را در توان طراحی حرارتی ۲۹۵ واتی انجام میدهد. تنها خود این مقدار ۳٫۵ برابر جهش عملکردی نسبت به معماری گرافیکی تورینگ را نشان میدهد و مشخص میکند که دقیقا انتظار چه چیزی را باید از کارتهای گرافیک نسل بعدی انویدیا داشت. کنفرانس سالانهی فناوری کارتهای گرافیکی (The GPU Technology Conference) یا به اختصار GTC، یکی از بزرگترین رویدادها در زمینهی کارتهای گرافیک، پردازندهها و هوش مصنوعی است.
انویدیا اظهار داشته که پلتفرم DRIVE AGX Orin از سطح ۲ تا ۵ وسایل نقلیهی خودران، سازگار بوده و قابلیت توسعهپذیری را دارد. سیستم محاسبهگر یادشده بهگونهای طراحی شده تا درحالیکه اپلکیشنهای مختلفی را اجرا میکند که مبتنی بر هوش مصنوعی یا شبکههای عصبی عمیق (DNN) هستند، استانداردهای سیستمی امنیتی مانند ISO 26262 ASIL-D را نیز رعایت کند. درست همانند نسل پیشین خود یعنی خاویِر، پردازندهی Orin قرار است در خودروهایی که سال ۲۰۲۲ تولید میشوند، یعنی دو سال بعد از رونمایی از این تراشه، به کار برده شوند. درنتیجه ساخت این پلتفرم باید زودتر از زمان یادشده و احتمالا از سال ۲۰۲۱ آغاز شود.
مقایسهی نسلهای مختلف پلتفرم Drive PX انویدیا
نام محصول | انویدیا Drive PX | انویدیا Drive PX | انویدیا Drive Xavier | انویدیا Drive Pegasus | انویدیا Drive AGX Orin |
---|---|---|---|---|---|
نام Soc | Tegra X1 | Parker | Xavier | Xavier | Orin |
لیتوگرافی | ۲۰ نانومتری | ۱۶ نانومتری فینفت (FinFET) | ۱۲ نانومتری فینفت (FinFET) | ۱۲ نانومتری فینفت (FinFET) | نامشخص |
تعداد ترانزیستور روی SoC | ۲ میلیارد | نامشخص | ۷ میلیارد روی هر تراشهی Xavier | ۷ میلیارد روی هر تراشهی Xavier | ۱۷ میلیارد روی هر تراشهی Orin |
معماری گرافیکی | Maxwell با ۲۵۶ هسته | Pascal با ۲۵۶ هسته | Volta با ۵۱۲ هسته | Volta با ۵۱۲ هسته | Ampere؟ |
پردازنده | ۱۶ هستهای ARM | ۱۲ هستهای ARM | ۸ هستهای ARM | ۱۶ هستهای ARM | ۱۲ هستهای ARM |
معماری پردازنده | ۸ هستهی Cortex A57 ۸ هستهی Cortex A53 | ۴ هستهی Denver ۸ هستهی Cortex A57
| ۸ هستهی ۶۴ بیتی Carmel ARM داری ۸ مگابایت حافظهی کش سطح ۲ و ۴ مگابایت کش سطح ۳ | ۸ هستهی ۶۴ بیتی Carmel ARM داری ۸ مگابایت حافظهی کش سطح ۲ و ۴ مگابایت کش سطح ۳
| هستههای هرکول (Herclues) شرکت ARM |
تعداد ترا عملیات بر ثانیه، مبتنیبر (DLTOPs) | نامشخص | ۲۰ DLTOPs | ۳۰ TOPs | ۳۲۰ TOPs | ۲۰۰ TOPs |
تعداد تراشهها | ۲ تراشهی Tegra X1 | ۲ تراشهی Tegra X1 ۲ عدد پردازندهی گرافیکی Pascal MXM | یک تراشهی Xavier | ۲ تراشهی Volta ۲ تراشهی Turing | یک تراشهی Ampere |
حافظهی سیستم | LPDDR4 | ۸ گیگابایت LPDDR4 | ۱۶ گیگابایت حافظهی ۲۵۶ بیتی LPDDR4 | LPDDR4 و GDDR6 | نامشخص |
حافطهی کارت گرافیک | نامشخص | ۴ گیگابایت GDDR5 | ۱۳۷ گیگابایت بر ثانیه | ۱ ترابایت بر ثانیه | ۲۰۰ گیگابایت بر ثانیه |
توان طراحی حرارتی (TDP) | ۲۰ وات | ۸۰ وات | ۳۰ وات | ۵۰۰ وات | نامشخص |
پردازندهی خاویِر نیز در سال ۲۰۱۶ میلادی رونمایی شد، اما بهکارگیری آن در وسایل نقلیه از اواخر سال ۲۰۱۷ و اوایل سال ۲۰۱۸ آغاز شد. با تمامی موارد ذکرشده، پردازندهی گرافیکی پلتفرم Drive PX Pegasus، ولتا یک سال پس از رونمایی از این پلتفرم در قالب کارت گرافیک Titan V روانهی بازار شد. بازههای زمانی مذکور میتواند درک درستی از زمان رونمایی از نسل بعدی کارتهای گرافیکی انویدیا تحت معماری Ampere را پیش روی کاربران قرار دهد. هرچه به رویداد CES ۲۰۲۰ نزدیکتر میشویم، جزئیات بیشتری از انویدیا در مورد نقشهی راه محصولات و معماری جدید این شرکت خواهیم شنید.
نظرات