شرکت هوش مصنوعی دیپ‌سیک / DeepSeek

زلزله در دنیای هوش مصنوعی؛ چطور چینی‌ها با دیپ‌سیک دنیا را غافلگیر کردند

پنج‌شنبه ۱۱ بهمن ۱۴۰۳
مطالعه 12 دقیقه
شرکت چینی دیپ‌سیک با ارائه مدلی ارزان‌ اما قدرتمند، معادلات هوش مصنوعی را به هم ریخته و رقبای غربی را به چالش کشیده است.
تبلیغات

اگر در یکی، دو روز گذشته پیگیر اخبار هوش مصنوعی، چت‌جی‌پی‌تی، انویدیا یا حتی بازار بورس آمریکا بوده باشید، به‌احتمال زیاد نام «دیپ‌سیک» (DeepSeek) زیاد به گوشتان خورده است؛ مدل هوش مصنوعی متن‌باز ساخت چین که از ChatGPT سبقت گرفت و پردانلود‌ترین نرم‌افزار رایگان اپ استور شد؛ تحسین سم آلتمن، مدیرعامل شرکت خالق ChatGPT را برانگیخت؛ مارک زاکربرگ، مدیرعامل متا را به تشکیل «اتاق جنگی» برای بررسی راز موفقیت «یک‌شبه‌ی» دیپ‌سیک واداشت و دونالد ترامپ، رییس‌جمهور آمریکا‌ آن را «زنگ خطری» برای شرکت‌های آمریکایی خواند.

اما شاید مهم‌تر از همه، موفقیت غیرمنتظره‌ی دیپ‌سیک باعث شد انویدیا، غول تراشه‌سازی سه‌ونیم تریلیون دلاری، با ازدست‌دادن حدود ۶۰۰ میلیارد دلار از ارزش بازار خود، بزرگ‌ترین کاهش ارزش یک‌روزه در تاریخ وال‌استریت را رقم بزند. تسلا، گوگل، آمازون، مایکروسافت و حتی شرکت‌های کوچک‌تری چون اوپن‌ای‌آی، همگی از موفقیت انفجاری دیپ‌سیک آسیب دیدند و بازار بورس آمریکا با ریزش ۱٫۵ تریلیون دلاری روبه‌رو شد.

آیا واقعا به میلیاردها دلار قدرت محاسباتی برای چیرگی در رقابت هوش مصنوعی نیاز است؟

دیپ‌سیک در یک‌ چشم برهم زدن توانست نگاه کل صنعت تکنولوژی و حتی جهان را به خود جلب کند. برخی از کارشناسان می‌گویند دو مدل هوش مصنوعی دیپ‌سیک که در فاصله‌ی تنها چهار ماه از یکدیگر عرضه شده‌اند، هم‌تراز با بهترین مدل‌های تولید‌شده در آزمایشگاه‌های آمریکایی هستند.

در این بین، ادعای شرکت که مدل هوش مصنوعی‌اش را با تراشه‌های پیشرفته‌ی کمتر و درنتیجه، هزینه‌ای به‌مراتب کمتر از مدل‌های پیشرو صنعت ساخته است و درعین‌حال، عملکردی یکسان و چه بسا قدرتمندتر ارائه می‌دهد، بیش از هر چیز بازار هوش مصنوعی را تکان داد. آنطورکه پیداست، هزینه‌ی توسعه‌ی یکی از آخرین مدل‌های دیپ‌سیک، تقریبا با حقوق یک متخصص هوش مصنوعی در آمریکا برابری می‌کند.

موفقیت دیپ‌سیک این پرسش را مطرح می‌کند که آیا واقعا به میلیاردها دلار قدرت محاسباتی برای چیرگی در رقابت هوش مصنوعی نیاز است؟ این موفقیت همچنین تاثیر محدودیت‌های آمریکا برای جلوگیری از پیشرفت چین در صنعت تراشه را زیر سوال می‌برد. چین این‌روزها هوش مصنوعی را با تاکید بیشتری در اولویت قرار داده است و ظهور استارتاپ‌هایی مانند دیپ‌سیک برای تغییر مسیر این کشور از تولیدات سنتی به تراشه، خودروهای برقی و هوش مصنوعی، حیاتی هستند.

اما چطور یک استارتاپ گمنام چینی تنها در عرض دو سال توانست به داغ‌ترین موضوع سیلیکون‌ولی تبدیل شود و کل صنعت هوش مصنوعی را به وحشت بیندازد؟

کپی لینک

دیپ‌سیک چیست؟

دیپ‌سیک استارتاپی است که در سال ۲۰۲۳ در شهر ژجیانگ تاسیس شد و بااینکه کمتر از دو سال از تاسیس آن می‌گذرد، برجسته‌ترین شرکت هوش مصنوعی چین به‌شمار می‌رود. این شرکت از یک صندوق پوشش ریسک به‌نام های‌فلایر که توسط مهندسان دانشگاه دولتی ژجیانگ راه‌اندازی شده بود، متولد شد و مانند OpenAI، هدفش را توسعه‌ی هوش مصنوعی انسان‌گونه (AGI) با تمرکز بر «نوآوری‌های معماری و الگوریتمی تحول‌آفرین» اعلام کرده است؛ اما برخلاف OpenAI، فعلا برنامه‌ای برای تجاری‌سازی ندارد و چت‌‌باتش متن‌باز است؛ به این معنی که کد چت‌بات برای مشاهده، استفاده و اصلاح دردسترس عموم قرار دارد.

در سال ۲۰۲۱ و درست پیش از اعمال تحریم‌های آمریکا علیه صادرات تراشه به چین، لیانگ ونفنگ (Liang Wenfeng)، مهندس علوم کامپیوتر چینی ، شروع به خرید هزاران GPU از انویدیا کرد و دو سال بعد، دیپ‌سیک را با هدف دستیابی به AGI راه‌اندازی کرد. درواقع، لیانگ داشت همان جملات جاه‌طلبانه‌ای را به زبان می‌آورد که سم آلتمن و دیگران رهبران این صنعت مطرح می‌کنند.

هدف نهایی ما دستیابی به AGI است؛ برای رسیدن به این هدف نیاز داریم ساختارهای جدیدی برای مدل‌های زبانی را بررسی کنیم تا بتوانیم با منابع محدود، مدل‌های توانمندتر بسازیم.
- لیانگ ونفنگ، مدیرعامل دیپ‌سینک

و این دقیقا همان کاری است که دیپ‌سیک انجام داد. این شرکت با استفاده از چندین رویکرد فنی نوآورانه، دو مدل DeepSeek-V3 و DeepSeek-R1 را به فاصله‌ی کمی از یکدیگر در سال ۲۰۲۴ عرضه کرد. دیپ‌سیک مدعی است که هزینه‌ی نهایی آموزش مدل V3 تنها ۵٫۶ میلیون دلار بوده است؛ یعنی ۹۵ درصد کمتر از هزینه‌ی آموزش مدل o1 شرکت OpenAI که از آن به‌عنوان نقطه‌ی عطفی در تکامل هوش مصنوعی یاد می‌شود. از سوی دیگر، API مدل‌های OpenAI برای هر میلیون توکن ورودی ۱۵ دلار هزینه دارد؛ در‌حالی‌که هزینه‌ی دیپ‌سیک R1 فقط ۰٫۵۵ دلار به‌ازای هر میلیون توکن ورودی است؛ یعنی ۲۷ برابر ارزان‌تر.

با‌این‌حال، نیتن لمبرت، متخصص یادگیری ماشینی، درباره‌ی هزینه واقعی دیپ‌سیک تردید دارد. او اشاره کرده است که هزینه اعلام‌شده ۵ میلیون دلاری برای آموزش مدل ۶۷۱ میلیارد پارامتری تمام واقعیت را نشان نمی‌دهد.

لمبرت درباره‌ی هزینه‌ی توسعه‌ی دیپ‌سیک می‌افزاید که هزینه‌هایی مانند حقوق محققان و زیرساخت‌ها و برق در محاسبات لحاظ نشده‌اند و او تخمین می‌زند که هزینه‌ی سالانه اجرای دیپ‌سیک AI بین ۵۰۰ میلیون تا بیش از ۱ میلیارد دلار باشد. با‌این‌حال، این پروژه همچنان دستاوردی بزرگ محسوب می‌شود؛ مخصوصاً وقتی در نظر بگیریم که مدل‌های آمریکایی در حال رقابت، سالانه ۱۰ میلیارد دلار برای توسعه‌ی هوش مصنوعی هزینه می‌کنند.

درحالی‌که مدیرعامل آنتروپیک هزینه‌ی آموزش مدل را چیزی بین ۱۰۰ میلیون تا یک میلیارد دلار می‌داند و اوپن‌ای‌آی هزینه‌ی توسعه‌ی GPT-4 را بیش از ۱۰۰ میلیون دلار برآورد کرده است، بسیاری از متخصصان شک دارند که هزینه‌ی توسعه‌ی مدل ۶۷۱ میلیارد پارامتری دیپ‌سیک واقعا ۶ میلیون دلار بوده باشد.

آن‌ها معتقدند که در محاسبات دیپ‌سیک، هزینه‌هایی مانند حقوق محققان و زیرساخت‌ها و برق لحاظ نشده‌اند و احتمالا هزینه‌ی سالانه اجرای هوش مصنوعی این شرکت بین ۵۰۰ میلیون تا بیش از یک میلیارد دلار باشد؛ بااین حال، وقتی در نظر بگیریم که مدل‌های آمریکایی، سالانه ۱۰ میلیارد دلار برای توسعه‌ی هوش مصنوعی هزینه می‌کنند، مدل دیپ‌سیک همچنان می‌تواند قاعده‌ی بازی را عوض کند و سوددهی شرکت‌های متمرکز بر هوش مصنوعی مصرفی را تحت‌الشعاع قرار دهد.

بااین‌حال، دیپ‌سیک برخلاف گوگل و OpenAI، کارش را کاملا از صفر شروع نکرد؛ این شرکت مدل هوش مصنوعی خود را به‌کمک مدل‌های متن‌باز موجود توسعه داد؛ ازجمله مدل Llama شرکت متا. دیپ‌سیک می‌گوید برای آموزش مدل‌هایش، از داده‌های مصنوعی (Synthetic Data) استفاده کرده است؛ یعنی داده‌هایی که به جای انسان‌ها، توسط الگوریتم‌ها و مدل‌های کامپیوتری تولید می‌شوند و مزایایی ازجمله حفظ حریم شخصی، کاهش هزینه و زمان و افزایش کارایی مدل را به همراه دارند.

روش‌های دیپ‌سیک برای بهینه‌سازی مدل جدید نیستند؛ اما ترکیب موفقیت‌آمیز آن‌ها تحسین‌برانگیز است

دیپ‌سیک روش‌های هوشمندانه‌‌ای برای استفاده از GPUهای ارزان‌تر و بهینه‌سازی آموزش مدل هوش مصنوعی خود پیدا کرد. روش‌هایی که اکثرا جدید نیستند، اما ترکیب موفقیت‌آمیز آن‌ها برای توسعه‌ی مدل زبانی پیشرفته تحسین‌برانگیز است.

جدول امتیازهای مدل دیپ سیک درمقایسه با مدل‌های دیگر
جدول امتیازهای مدل دیپ سیک درمقایسه با مدل‌های دیگر

جدول امتیاز دیپ‌سیک، برتری مدل V3 را در بسیاری از بنچمارک‌های کد و ریاضی نشان می‌دهد

مایلز براندیج، پژوهشگر سابق سیاست‌گذاری در OpenAI، از دو ترفند پیش‌آموزش و یادگیری تقویتی کارآمدتر بر پایه‌ی استدلال زنجیره‌ای (Chain-of-Thought Reasoning) نام می‌برد. به عبارت ساده‌تر، دیپ‌سیک از تکنیک نسبتا جدیدی استفاده کرد که به مدل اجازه می‌داد به‌جای تقلید صرف از رفتار انسان، مرحله‌به‌مرحله و از طریق آزمون‌ و خطا (یادگیری تقویتی) مسائل را حل کند. این روش باعث شد مدل بتواند با توان محاسباتی و هزینه‌ی به‌مراتب کمتر، به سطح عملکرد مدل o1 اوپن‌ای‌آی دست یابد.

نسخه‌ی سوم و دوم DeepSeek اساسا از همان نوع مدل‌هایی هستند که در GPT-4 استفاده شده، اما با مهندسی هوشمندانه‌تر تا بهره‌وری GPUها افزایش یابد.
- مایلز براندیج، پژوهشگر سابق سیاست‌گذاری در OpenAI

البته آزمایشگاه‌های دیگر هم از این روش‌ها استفاده می‌کنند. برای مثال، روش «Mixture of Experts» که دیپ‌سیک در آموزش مدل‌هایش استفاده کرده، در GPT-4 نیز به کار گرفته شده است. این روش به‌کمک مجموعه‌ای از «متخصصان» (Experts) که هرکدام در پردازش نوع خاصی از داده‌ها مهارت دارند، فقط بخش‌های خاصی از مدل را که برای آن ورودی مفید هستند، فعال می‌کند تا بدین‌ترتیب در عین افزایش دقت، هزینه و قدرت پردازشی را کاهش دهد.

اما دیپ‌سیک با ایجاد دسته‌بندی‌های تخصصی‌تر و توسعه‌ی روشی کارآمدتر برای ارتباط میان این بخش‌ها، تکنیک MoE را بهبود داد و کل فرایند آموزش را بهینه‌تر کرد. علاوه‌براین، پژوهشگران دیپ‌سیک، تکنیک Multi-Head Latent Attention را به‌گونه‌ای بهبود دادند تا با فشرده‌سازی روش‌های ذخیره و بازیابی اطلاعات در مدل، میزان حافظه‌ی موردنیاز برای پردازش درخواست‌ها را به‌طور چشمگیری کاهش دهد. درواقع، جدیدترین مدل دیپ‌سیک به‌قدری بهینه است که توسعه‌ی آن تنها به یک‌دهم قدرت پردازشی مدل Llama 3.1 شرکت متا نیاز داشت.

کپی لینک

در سایه‌ی تحریم‌ها؛ دیپ‌سیک از چه سخت‌افزاری استفاده کرد؟

یکی از داغ‌ترین موضوعاتی که درباره‌ی دیپ‌سیک مطرح می‌شود، سخت‌افزاری است که برای توسعه‌ی مدل‌ های زبانی بزرگ از آن‌ها استفاده کرد؛ آن هم در سایه‌ی تحریم‌های آمریکا که توانایی چین در به‌دست‌آوردن و تولید تراشه‌های پیشرفته‌ برای ساخت این مدل‌ها را به‌شدت محدود کرده است.

ممنوعیت صادرات تراشه‌های پیشرفته به چین که به‌طور جدی در اکتبر ۲۰۲۳ آغاز شد، نسبتا جدید است و تأثیر کامل آن هنوز احساس نشده. بااین‌حال، درمورد توسعه‌ی هوش مصنوعی به‌نظر می‌رسد آمریکا و چین رویکردهای متضادی در پیش گرفته‌اند. درحالی‌که آمریکا روی قدرت خام شرط‌بندی بزرگی کرده است (مانند پروژه‌ی ۵۰۰ میلیارد دلاری آلتمن با ترامپ)، دیپ‌سیک به‌دلیل دسترسی به منابع محدود، سراغ بهینه‌سازی رفته است.

دیپ‌سیک می‌گوید به ۱۰هزار تراشه A100 انویدیا دسترسی دارد

دیپ‌سیک در یک مقاله‌ی پژوهشی منتشرشده در آگوست ۲۰۲۴، اعلام کرد که به مجموعه‌ای متشکل از ۱۰,۰۰۰ تراشه‌ی A100 انویدیا دسترسی دارد که صادرات آن‌ها به چین در اکتبر ۲۰۲۲ ممنوع شده بود. در مقاله‌ی دیگری در ماه ژوئن همان سال، دیپ‌سیک اشاره کرد که مدل قدیمی‌تر DeepSeek-V2 با استفاده از خوشه‌هایی از تراشه‌های H800 انویدیا توسعه یافته است. انویدیا این تراشه را برای رعایت قوانین کنترل صادرات آمریکا، با توان پردازشی کمتری تولید کرده است.

منابع دیگر تخمین می‌زنند که دیپ‌سیک احتمالا از چیزی حدود ۵۰,۰۰۰ تراشه‌ی انویدیا برای توسعه‌ی فناوری خود استفاده کرده است. انویدیا از اظهارنظر مستقیم درباره‌ی اینکه دیپ‌سیک دقیقا از کدام تراشه‌های این شرکت استفاده کرده، خودداری کرد؛ بااین‌حال، سخنگوی غول تراشه‌سازی در بیانیه‌ای گفت که «دیپ‌سیک پیشرفت چشمگیری در صنعت هوش مصنوعی» از خود به نمایش گذاشت و اضافه کرد که روش استنتاجی این استارتاپ برای آموزش مدل، «به تعداد قابل‌توجهی از GPU‌های انویدیا و شبکه‌های پردازشی پرقدرت نیاز دارد.»

دانشمند ارشد دیپ‌سیک پیش‌تر کارمند انویدیا بوده

جالب اینکه دانشمند ارشد دیپ‌سیک، زی‌ژنگ پن، که در توسعه‌ی مدل‌های DeepSeek-VL2 و DeepSeek-V3 و DeepSeek-R1 نقش کلیدی داشته، پیش‌تر کارمند انویدیا بوده است. به‌گفته‌ی ژیدینگ یو، دانشمند ارشد تحقیقاتی در انویدیا، «زی‌ژنگ یکی از کارآموزان ما در انویدیا در تابستان ۲۰۲۳ بود. بعدها، زمانی که قصد داشتیم پیشنهاد استخدام تمام‌وقت به او بدهیم، به دیپ‌سیک پیوست. در آن زمان، تیم هوش مصنوعی چندوجهی دیپ‌سیک تنها سه عضو داشت.»

صرف‌نظر از اینکه مدل‌های دیپ‌سیک دقیقا با چه تراشه‌ای توسعه یافته‌اند، به نظر می‌رسد این‌روزها رویکرد متن‌باز در حوزه‌ی هوش مصنوعی درحال کسب نفوذ و محبوبیت بیشتری است؛ این موضوع زنگ خطری برای شرکت‌های بسته‌ای چون OpenAI است که روزی می‌خواست اولین شرکت دنیا باشد که به AGI دست پیدا می‌کند.

کپی لینک

چرا دیپ‌سیک دنیا را شگفت‌زده کرد؟

هوش مصنوعی به توان محاسباتی عظیم و هزینه‌های هنگفت نیاز دارد؛ تاحدی که قدرتمندترین مدیران فناوری آمریکا در حال خرید نیروگاه‌های هسته‌ای هستند تا برق موردنیاز مدل‌های هوش مصنوعی خود را تامین کنند.

همین چند وقت پیش، متا اعلام کرد که امسال بیش از ۶۵ میلیارد دلار برای توسعه‌ی هوش مصنوعی هزینه خواهد کرد. اوپن‌ای‌آی هم سال گذشته برآورد کرد که صنعت هوش مصنوعی به تریلیون‌ها دلار سرمایه‌گذاری برای تامین تراشه‌های پیشرفته نیاز دارد.

بنابراین، تصور اینکه مدل‌هایی با عملکرد مشابهِ قدرتمندترین مدل‌های هوش مصنوعی آمریکا می‌توانند با هزینه‌‌ای به‌مراتب کمتر و با تراشه‌هایی به‌مراتب ضعیف‌تر توسعه یابند، درک صنعت از میزان سرمایه‌گذاری موردنیاز در حوزه‌ی هوش مصنوعی را زیرورو کرده است.

هوش مصنوعی منتقدان و مخالفان زیادی دارد، اما حامیانش نوید آینده‌ای پرسود می‌دهند. برای مثال، لیسا سو، مدیرعامل AMD، تاثیر هوش مصنوعی بر زندگی روزمره و پژوهش‌های بشری در آینده را با تاثیر اینترنت، ظهور گوشی‌های هوشمند و فضای ابری یکسان می‌داند و معتقد است آنچه اکنون از هوش مصنوعی می‌بینیم، تنها نوک کوه یخ است.

اگر چنین قدرت متحول‌کننده‌ای بتواند با چنین هزینه‌ی کمی به دست آید، آن‌وقت دنیا با فرصت‌های جدید و البته تهدیدهای جدیدی روبه‌رو خواهد شد.

در این میان، شرکتی که از هیاهوی این تکنولوژی نوظهور بیشترین سود را برده، انویدیا است که تراشه‌های پیشرفته‌ی مورداستفاده‌ی شرکت‌های هوش مصنوعی را تولید می‌کند. تصور سرمایه‌گذاران این بود که در دوران «تب طلای هوش مصنوعی»، خرید سهام انویدیا به‌معنی سرمایه‌گذاری روی شرکتی است که «بیل‌وکلنگ» این صنعت را تولید می‌کند. مهم نیست کدام شرکت درنهایت در رقابت هوش مصنوعی پیروز شود؛ چراکه تمام آن‌ها برای اجرای مدل‌های خود به انبوهی از تراشه‌های انویدیا نیاز خواهند داشت. این تصور کمک کرد در ۲۷ دسامبر ۲۰۲۴، ارزش سهام انویدیا به ۱۳۷ دلار برسد؛ تقریبا ۱۰ برابر ارزش آن در ابتدای ژانویه‌ی ۲۰۲۳.

چطور دیپ‌سیک توانست دستاوردهای چندساله OpenAI را فقط در عرض چند ماه بازتولید کند؟

اما موفقیت دیپ‌سیک این تصور را که باعث افزایش نجومی ارزش سهام انویدیا شد، زیر سؤال می‌برد. اگر این استارتاپ به‌جای آنکه صرفا تراشه‌ی بیشتری بخرد، واقعا راهی پیدا کرده است تا از آن‌ها به‌طور کارآمدتری استفاده کند، شرکت‌های دیگر نیز به همین روش روی خواهند آورد. این تغییر می‌تواند کاهش تقاضا برای پیشرفته‌ترین تراشه‌های انویدیا را در پی داشته باشد؛ چراکه شرکت‌ها همیشه در تلاشند هزینه‌های خود را کاهش دهند.

اما درباره‌ی جنبه‌ی دیگری از ماجرا کمتر صحبت می‌شود؛ این‌که چطور دیپ‌سیک توانست دستاوردهای چندساله‌ی OpenAI را فقط در عرض چند ماه بازتولید کند. اوپن‌ای‌آی شبیه TSMC برای دنیای تراشه، خود را به‌عنوان تنها شرکتی که قادر به ساخت هوش مصنوعی پیشرفته است، معرفی کرده و با این تصویر، حمایت سرمایه‌گذاران را برای ساخت بزرگ‌ترین دیتاسنتر هوش مصنوعی جهان به دست آورده است. اما دستاورد یک‌شبه‌ی دیپ‌سیک نشان می‌دهد برتری‌های فنی دوام چندانی ندارند؛ حتی زمانی‌که شرکت‌ها تلاش می‌کنند روش‌های خود را محرمانه نگه دارند.

بخشی از ارزش شرکت‌های بسته‌ای چون OpenAI به این وابسته است که مردم تصور کنند آن‌ها در حال انجام کارهای بسیار مهمی هستند که از توان بسیاری از شرکت‌ها خارج است. این تصور برای ایجاد هیاهوی تبلیغاتی و جذب سرمایه‌ی بیشتر یا توسعه‌ی پروژه‌های جدید لازم است. اما دیپ‌سیک نشان داد برای رسیدن به جایگاه اوپن‌ای‌آی، نیازی به سرمایه‌‌های صدها میلیون دلاری نیست. عجیب نیست که این موضوع دست‌کم برای چند ساعت، بازار بورس آمریکا را به وحشت انداخت.

کپی لینک

موفقیت دیپ‌سیک چه معنایی برای آینده هوش مصنوعی دارد؟

موفقیت دیپ‌سیک نشان داد که ریخت‌وپاش مالی عامل تضمین‌کننده‌ی برتری نیست؛ هرچند برخی از کارشناسان به ادعای این شرکت درمورد هزینه‌ی نهایی آموزش مدل شک دارند و می‌گویند هزینه‌ها بسیار بیشتر از چیزی است که اعلام شده.

برخی احساس می‌کنند محدودیت‌های صادراتی آمریکا شکست خورده و به‌جای کاهش سرعت پیشرفت فناوری چین، آن‌ها را مجبور به نوآوری کرده است. برای برخی هم، موفقیت دیپ‌سیک نشان‌دهنده‌ی از دست رفتن برتری آمریکا در حوزه‌ی هوش مصنوعی است.

عده‌ای معتقدند این وضعیت مقطعی است و بازار بورس و صنعت هوش مصنوعی دوباره به حالت قبل باز می‌گردد؛ اما تعدادی از کارشناسان، این وضعیت را نشانه‌ای از یک تحول فناوری می‌دانند؛ اینکه شرکت‌های هوش مصنوعی به جای تلاش برای ایجاد مدل‌های بزرگ‌تر و پرهزینه‌تر، اکنون بیشتر بر توسعه‌ی قابلیت‌های پیشرفته، مانند استدلال و منطق، متمرکز شده‌اند.

درست است که چت‌بات دیپ‌سیک در اپ‌استور از ChatGPT پیشی گرفته، اما باید محدودیت‌هایش را هم در نظر گرفت. به گفته‌ی وال استریت ژورنال، استارتاپ‌های چینی موظفند توانایی مدل به پاسخ‌گویی به مجموعه‌ای از ۵,۰۰۰ تا ۱۰,۰۰۰ سؤال را که تقریباً نیمی از آن‌ها مربوط به ایدئولوژی‌های سیاسی است، مسدود کنند. طبق گزارشی جدید از PromptFoo، مدل R1 از پاسخ‌گویی به حدود ۸۵ درصد از ۱,۳۶۰ پرامپت مربوط به موضوعات حساس درباره‌ی مسائل کشور چین خودداری می‌کند. سرعت پاسخ‌گویی مدل هم به‌مراتب پایین‌تر از چت‌جی‌پی‌تی است. داده‌های کاربران نیز به سرورهای چین منتقل می‌شود که برای دسته‌ای از کاربران، نگرانی‌هایی درباره‌ی سانسور و حریم خصوصی ایجاد می‌کند.

دیپ‌سیک باوجود کاهش هزینه‌های توسعه، احتمالاً تأثیر مثبتی بر محیط‌زیست نخواهد داشت؛ چراکه منابع محاسباتی کارآمدتر به این معناست که شرکت‌ها از قدرت پردازشی بیشتری برای بهبود مدل‌های خود استفاده خواهند کرد. از سوی دیگر، کارشناسان معتقدند که این پیشرفت به استارتاپ‌های کوچک‌ و پژوهشگران امکان دسترسی آسان‌تر به بهترین مدل‌ها را می‌دهد و درنتیجه، نیاز به محاسبات افزایش خواهد یافت.

شاید در آینده افراد بتوانند مدل‌های پیشرفته‌ هوش مصنوعی را در گاراژ خانه‌ توسعه دهند

دیپ‌سیک برای آموزش مدل‌های خود از داده‌های مصنوعی استفاده می‌کند؛ این موضوع نشان می‌دهد که آزمایشگاه‌های هوش مصنوعی می‌توانند بدون نیاز به استخراج گسترده‌ی داده از اینترنت و نقض کپی‌رایت و حریم شخصی، مدل‌های مفیدی تولید کنند. اما آسیبی که تاکنون به اینترنت وارد شده، غیرقابل بازگشت است؛ چراکه تنها یک اینترنت وجود دارد و مدل‌های آینده بر پایه‌ی داده‌هایی که قبلاً از آن استخراج شده‌اند، ساخته خواهند شد.

ماجرای دیپ‌سیک همچنین نشان داد که استارتاپ‌های کوچک می‌توانند بسیار رقابتی‌تر از غول‌های این صنعت باشند و حتی رهبران شناخته‌شده را با نوآوری‌های فنی به چالش بکشند. بنابراین، اگرچه موفقیت دیپ‌سیک خبر بدی برای بازیگران بزرگ محسوب می‌شود، می‌تواند خبر خوبی برای استارتاپ‌های کوچک هوش مصنوعی باشد؛ به‌ویژه چون مدل‌های دیپ‌سیک متن‌باز هستند.

ابزارهای قدرتمند هوش مصنوعی به‌زودی بسیار مقرون‌به‌صرفه‌تر خواهند شد و رهبران این حوزه وعده داد‌ه‌اند که پیشرفت‌ها با سرعت زیادی ادامه خواهند یافت. شاید روزی برسد که افراد بتوانند مدل‌های پیشرفته‌ی هوش مصنوعی را در گاراژ خانه‌شان توسعه دهند.

اما در این سناریو، چه بر سر AGI می‌آید؟ وقتی اوپن‌ای‌آی کارش را شروع کرد، قصد داشت این صنعت را به ایمن‌ترین شکل ممکن توسعه دهد و مزایای هوش مصنوعی به‌طور مساوی در جهان توزیع شود (یا دست‌کم اینطور ادعا می‌کرد). دانشمندان این حوزه عموماً بر این باورند که اگر توسعه‌ی AGI مسیری با کمترین مقاومت را دنبال کند؛ یعنی نهادی نباشد تا برای آن قوانین سخت‌گیرانه وضع کند، به‌راحتی می‌تواند از کنترل خارج شود. اما آیا این هدف همچنان پابرجاست؟ و اگر چین زودتر از دیگران به هوش انسان‌گونه دست یابد، چه تأثیری بر جهان خواهد داشت؟

مقاله رو دوست داشتی؟
نظرت چیه؟
داغ‌ترین مطالب روز

نظرات

0 دیدگاه ثبت شده، نظر تو چیه؟

برای درج نظر وارد شو یا ثبت‌نام کن

با چشم باز خرید کنید
زومیت شما را برای انتخاب بهتر و خرید ارزان‌تر راهنمایی می‌کند
ورود به بخش محصولات