انویدیا B200 رونمایی شد؛ «ابرتراشه» هوش مصنوعی با ۲۰۸ میلیارد ترانزیستور
پردازندهی گرافیکی H100 که به طور ویژه روی هوش مصنوعی تمرکز دارد، انویدیا را به شرکتی چند تریلیون دلاری و ارزشمندتر از بزرگانی مثل آلفابت و آمازون تبدیل کرد.
در واکنش به محبوبیت عجیب H100، رقبای انویدیا تلاش کردند پردازندههایی همسطح با آن بسازند؛ اما تیم سبز با برگزاری مراسمی ویژه و رونمایی از تراشههای B200 و GB200 بر پایهی معماری Blackwell، رقابت را وارد مرحلهی کاملاً جدیدی کرد.
انویدیا در بیانیهای مطبوعاتی میگوید پردازندهی گرافیکی جدید B200 قدرت پردازشی حداکثر ۲۰ پتافلاپس در فرمت FP4 دارد و به ۲۰۸ میلیارد ترانزیستور مجهز است.
ابرتراشهی جدید GB200 که دو گرافیک انویدیا B200 را با یک پردازندهی مرکزی مبتنیبر معماری Grace ترکیب میکند، برای تعلیم مدلهای زبانی بزرگ، ۳۰ برابر قویتر از نسل قبل است. به ادعای انویدیا، تراشهی جدید باعث کاهش ۲۵ برابری هزینه و مصرف انرژی میشود.
تا قبل از رونمایی پردازندهی جدید انویدیا، تعلیم یک مدل هوش مصنوعی ۱٫۸ تریلیون پارامتری نیازمند استفاده از ۸٬۰۰۰ تراشهی Hopper و ۱۵ مگاوات برق بود، اما ازاینپس با ۲٬۰۰۰ پردازندهی Blackwell و مصرف تنها چهار مگاوات برق میتوان چنین کاری انجام داد.
ابرتراشهی GB200 تا ۳۰ برابر قویتر از نسل قبل است
انویدیا میگوید ابرتراشهی GB200 در یکی از بنچمارکهای هوش مصنوعی GPT-3 با ۱۷۵ میلیارد پارامتر میتواند هفت برابر قویتر از H100 ظاهر شود. سرعت تعلیم هوش مصنوعی با تراشهی جدید، چهار برابر سریعتر از قبل شده است.
به گفتهی انویدیا، یکی از بهبودهای مهم GB200 بهرهمندی از موتور ترنسفورمر نسل دوم است که قدرت محاسباتی، پهنای باند و ابعاد مدل را دو برابر میکند.
بهبود مهم دیگر تنها زمانی ارائه میشود که تعداد زیادی از ابرتراشههای انویدیا را به هم متصل کنید: سوئیچ نسل جدید NVLink که ارتباط حداکثر ۵۷۶ تراشهی گرافیکی را ممکن میکند و پهنای باند دوطرفه را به ۱٫۸ ترابایتبرثانیه میرساند.
انویدیا انتظار دارد که شرکتهای بزرگ صنعت فناوری تعداد زیادی از پردازندهی GB200 را خریداری کنند و به همین دلیل در حال بستهبندی آنها در پکیجهای بزرگی مثل GB200 NVL72 است که ۳۶ پردازندهی مرکزی و ۷۲ پردازندهی گرافیکی را وارد یک رکِ مبتنیبر خنککنندهی مایع میکند و قدرتش برای تعلیم هوش مصنوعی به ۷۲۰ پتافلاپس میرسد. این رک انویدیا تقریباً ۳٫۲ کیلومتر کابل در داخل خودش دارد!
هر ردیف در رک انویدیا شامل دو ابرتراشهی GB200 یا دو سوئیچ NVLink است. انویدیا میگوید یکی از این سیستمها توانایی پشتیبانی از مدل هوش مصنوعی ۲۷ تریلیون پارامتری را دارد. گزارشهای غیررسمی میگویند GPT-4 یک مدل ۱٫۷ تریلیون پارامتری است.
انویدیا میگوید که آمازون، گوگل، مایکروسافت و اوراکل قصد دارند رکهای NVL72 را وارد سرورهای هوش مصنوعی خود کنند. البته فعلاً مشخص نیست که آنها چه تعداد را خریداری خواهند کرد.
تیم سبز همچنین دستگاه DGX GB200 را عرضه میکند که مجموعاً ۲۸۸ پردازندهی مرکزی، ۵۷۶ پردازندهی گرافیکی، ۲۴۰ ترابایت رم و ۱۱٫۵ اگزافلاپس قدرت FP4 دارد.
معماری بلکول که فعلاً برای تراشههای هوش مصنوعی معرفی شده است، احتمالاً در آیندهای نهچندان دور وارد کارتهای گرافیک مصرفی سری RTX 5000 هم میشود.