گوگل با رونمایی Gemini عصر جدید هوش مصنوعی را آغاز کرد
گوگل پس از شایعههای فراوان سرانجام بزرگترین مدل زبانی خود را با نام جمنای (Gemini) رونمایی کرد. این مدل به حدی برای گوگل اهمیت دارد که سوندار پیچای، مدیرعامل، آن را آغاز عصر جدید هوش مصنوعی در این شرکت میداند. به روایت پیچای، ازاینپس شاهد «عصر جمنای» هستیم.
مدل زبانی بزرگ جمنای نخستینبار در مراسم I/O 2023 گوگل مورد اشاره قرار گرفته بود و حالا بهصورت عمومی قابل دسترس است.
گوگل میگوید جمنای جهش روبهجلوی بزرگی برای این شرکت محسوب میشود و در نهایت روی تمامی سرویسهایی که غول آمریکایی صنعت فناوری ارائه میدهد، اثر خواهد گذاشت.
جمنای صرفا در یک نسخه ارائه نمیشود. گوگل نسخهی سبکتر این مدل زبانی بزرگ را با نام Gemini Nano معرفی کرده است که بهصورت بومی و آفلاین روی دستگاههای اندرویدی اجرا خواهد شد.
مدل دوم که Gemini Pro نام دارد، بهزودی وارد بسیاری از سرویسهای هوش مصنوعی گوگل میشود. چتبات گوگل بارد ازاینپس به مدل زبانی بزرگ Gemini Pro مجهز است.
گوگل نسخهی پیشرفتهتری از هوش مصنوعی جمنای را با نام Gemini Ultra معرفی کرده است که قدرتمندترین مدل زبانی بزرگ این شرکت محسوب میشود و ظاهرا برای دیتاسنترها و پردازشهای سازمانی توسعه داده شده.
گوگل فعلا قصد دارد به چند شیوه از هوش مصنوعی جمنای استفاده کند: چتبات بارد به Gemini Pro مجهز شده است و کاربران گوشی گوگل مدل پیکسل ۸ پرو بهلطف Gemini Nano به یکسری قابلیت جدید بر پایهی هوش مصنوعی دست پیدا میکنند. مدل زبانی Gemini Ultra در سال ۲۰۲۴ از راه خواهد رسید.
هوش مصنوعی Gemini توانست در ۳۰ آزمون از مجموع ۳۲ آزمون، GPT-4 را شکست دهد
بر اساس بیانیهی مطبوعاتی گوگل، توسعهدهندگان و سازمانها میتوانند در تاریخ ۱۳ دسامبر ۲۰۲۳ (۲۲ آذر ۱۴۰۲) ازطریق Google Generative AI Studio یا Vertex AI در سرویس گوگل کلاد به هوش مصنوعی Gemini Pro دسترسی پیدا کنند. Gemini فعلا فقط به زبان انگلیسی ارائه میشود، اما در آینده شاهد اضافهشدن زبانهای بیشتر به این مدل زبانی بزرگ خواهیم بود.
سوندار پیچای میگوید هوش مصنوعی جمنای در نهایت با موتور جستوجوی گوگل، سرویسهای تبلیغاتی، مرورگر کروم و سایر محصولات ادغام میشود. جمنای عملا آیندهی گوگل است.
شرکت OpenAI چتبات ChatGPT را یک سال و یک هفته قبل منتشر کرد و این سرویس آنلاین در زمانی کوتاه به محبوبیت قابل توجهی دست یافت. حالا گوگل -که خودش را یکی از پیشگامان حوزهی هوش مصنوعی میداند- سرانجام آماده است تا به جدیترین شکل ممکن با OpenAI رقابت کند.
گوگل ۳۲ بنچمارک تخصصی هوش مصنوعی را روی جمنای و GPT-4 انجام داد تا این دو مدل زبانی بزرگ را که هماکنون پرچمدارهای هوش مصنوعی محسوب میشوند، با یکدیگر مقایسه کند. به ادعای گوگل، جمنای در ۳۰ مورد از این آزمونها قویتر از GPT-4 عمل میکند تا دستاوردی عظیم برای غول آمریکایی ثبت شود.
به گفتهی مدیرعامل گوگل، ازاینپس شاهد «عصر جمنای» هستیم
در شماری از بنچمارکها تفاوت بین جمنای و GPT-4 چندان چشمگیر نیست، اما در برخی دیگر از آنها جمنای با تفاوت قابل توجه توانسته است جدیدترین مدل زبانی بزرگ OpenAI را پشت سر بگذارد.
بزرگترین پیروزی جمنای، در آزمون درک ویدیو و فایلهای صوتی و همچنین تعامل با آنها به دست آمده است. گوگل میگوید از همان آغاز توسعهی جمنای، روی چندوجهیبودن این هوش مصنوعی تمرکز کرده است و این تلاشها حالا نتیجه دادهاند.
گوگل برخلاف OpenAI هوش مصنوعی جدیدش را بر پایهی مدلهای مختلف برای عکس و صدا تعلیم نداد بلکه تصمیم گرفت «یک مدل چندحسی» را از پایه توسعه دهد. مدیرعامل گوگل دیپمایند، کسبوکار هوش مصنوعی گوگل، میگوید: «ما همیشه به سیستمهای بسیار عمومی علاقه داشتهایم.»
در حال حاضر نمونههای اولیهی جمنای متن را درک میکنند و در پاسخ، متن میسازند؛ با اینحال مدلهای قدرتمندتر مثل جمنای اولترا میتوانند همزمان با عکس و ویدیو و صدا نیز کار کنند. مدیرعامل گوگل دیپمایند میگوید که جمنای در آینده «عمومیتر» خواهد شد. جمنای قرار است چیزهایی مثل لمس را نیز درک کند و دقیقتر و «آگاهتر» شود.
نباید فراموش کنیم که بنچمارکها معیار کاملا دقیقی برای مقایسهی مدلهای زبانی بزرگ نیستند. مزایای جمنای نسبتبه GPT-4 در نهایت توسط کاربرانی سنجیده میشود که بهصورت روزمره از هوش مصنوعی برای انجام کارهای مختلف نظیر ایدهپردازی، دریافت اطلاعات جدید و کدنویسی استفاده میکنند.
هوش مصنوعی جمنای بهزودی با موتور جستوجوی گوگل و مرورگر کروم ادغام خواهد شد
گوگل معتقد است که جمنای در حوزهی کدنویسی هیچ رقیبی ندارد. این مدل زبانی به سیستم کدنویسی جدیدی به نام AlphaCode 2 مجهز است که تا ۸۵ درصد بهتر از سرویسهای رقیب عمل میکند و تا ۵۰ درصد بهتر از AlphaCode 1 شده است. سوندار پیچای میگوید کاربران جمنای در تمامی حوزههایی که این مدل زبانی روی آنها دست میگذارد، شاهد بهبود عملکرد خواهند بود.
ظاهرا بهرهوری جمنای بسیار بیشتر از مدلهای زبانی قبلی گوگل است. این هوش مصنوعی با استفاده از واحدهای پردازشی تنسور (Tensor) اختصاصی گوگل تعلیم داده شده است و نهتنها عملکرد سریعتری نسبتبه PaLM دارد، بلکه نگهداری آن ارزانتر است.
گوگل در کنار جمنای نسخهی جدید سیستم TPU را نیز رونمایی کرده است که TPU v5p نام دارد. این سیستم پردازشی در دیتاسنترها برای تعلیم مدلهای هوش مصنوعی و اجرای مدلهای زبانی بزرگ کاربرد خواهد داشت.
غول آمریکایی صنعت موتورهای جستوجو میگوید تلاش زیادی انجام داده است تا جمنای را ایمن بسازد. مدیرعامل گوگل دیپمایند میگوید ایمنی در مدلهای زبانی بزرگ نظیر جمنای اولترا اهمیت بسیار زیادی دارد و دقیقا به همین دلیل است که جمنای اولترا دیرتر از نسخههای دیگر منتشر میشود.
پیچای و سایر افراد حاضر در گوگل معتقدند که جمنای آغازگر پروژهای عظیم است. وب، گوگل را به یکی از بزرگان صنعت فناوری تبدیل کرد. اثرگذاری جمنای بر گوگل احتمالا بیشتر از وب خواهد بود.
نظرات