هوش مصنوعی فوق پیشرفته «جمنای لایو» با توانایی مکالمه زنده معرفی شد

سه‌شنبه ۲۵ اردیبهشت ۱۴۰۳ - ۲۳:۱۶
مطالعه 3 دقیقه
طرح گرافیکی هوش مصنوعی گوگل جمنای / Google Gemini روی موبایل
جمنای لایو با استفاده از دوربین و بررسی محیط اطراف، به سوالات پاسخ خواهد داد.
تبلیغات

گوگل قصد دارد چت‌بات جمنای را تاحدی توسعه دهد که بتواند دنیای انسان‌ها را بهتر درک کند و با آن‌ها راحت‌تر ارتباط بگیرد. گوگل در مراسم بزرگ I/O 2024 پیش‌نمایش نسخه‌ی جذاب جمنای موسوم به جمنای لایو را ارائه کرد که به کاربران امکان می‌دهد ازطریق گوشی‌های هوشمند خود مکالمه‌ی صوتی کامل و جامعی با جمنای داشته باشند.

کاربران می‌توانند زمانی که چت‌بات جمنای درحال پرسیدن سوال‌هایی برای شفاف‌سازی بیشتر است، مکالمه‌ی صوتی را قطع کنند؛ بنابراین جمنای از این طریق با الگوی گفتاری کاربر سازگار خواهد شد. هوش مصنوعی گوگل می‌تواند محیط اطراف کاربران را از طریق عکس‌ها یا ویدئوهایی که توسط دوربین گوشی‌ گرفته شده است، بررسی کند و به سوالات کاربر پاسخ دهد.

مکالمه‌ی صوتی زنده‌ی جمنای لایو
Google

جمنای لایو می‌تواند به سوالاتی درباره‌ی چیزهایی که در دید دوربین گوشی قرار دارند یا اخیراً قرار داشته‌اند، پاسخ دهد. به‌عنوان مثال به سوالاتی مانند اینکه کاربر الان در کدام محله است یا قطعه‌ی شکسته‌شده‌ی دوچرخه چه نام دارد، پاسخ خواهد داد.

جمنای لایو می‌تواند توضیح دهد که یک کد کامپیوتری چه کاربردی دارد یا مثلا بگوید که عینک‌ کاربر ممکن است در کجا قرار داشته باشد و اینکه به کاربر اعلام خواهد کرد که آخرین‌بار عینک را کجا دیده است.

سیسی هسیائو، مدیر جمنای در گوگل، می‌گوید: «با جمنای لایو، امکان درک بهتر کاربر به جمنای افزوده خواهد شد. جمنای لایو امکان تجربه‌ی مکالمه‌ی واقعی و زنده با هوش مصنوعی را فراهم می‌کند.»

جمنای لایو را می‌توان به‌عنوان نسخه‌ی تکامل‌یافته‌ی گوگل لنز، پلتفرم قدیمی بصری گوگل برای تجزیه و تحلیل تصاویر و ویدئوها و همچنین Google Assistant، دستیار مبتنی‌بر هوش مصنوعی گوگل، درنظر گرفت.

پاسخ جمنای لایو به سوال کاربر راجع‌به نام یک مکان
Google

نسخه‌ی لایو جمنای می‌تواند به‌عنوان یک مربی مجازی عمل کند و کاربران را برای رویدادهای مختلف و بارش ذهنی ایده‌های جدید تمرین دهد؛ به‌عنوان مثال به کاربران یاد می‌دهد برای اینکه یک فرصت شغلی را از آنِ خود کنند، نیاز به چه مهارت‌هایی دارند. جمنای لایو می‌توانند در انجام سخنرانی‌ها توصیه‌هایی را ارائه‌ دهد.

جمنای لایو، برای حل مشکلات پیچیده‌ی کاربران ازطریق مکالمه‌ی صوتی زنده، پاسخ‌هایی را در اختیار آن‌ها قرار خواهد داد. این نسخه‌ از جمنای با برخورداری از معماری مدل زیربنایی Gemini 1.5 Pro که پرچمدار هوش مصنوعی مولد جمنای به‌حساب می‌آید، از قابلیت به‌خاطرسپاری بالایی برخوردار است.

نسخه‌ی لایو جمنای دارای Context Window جدیدی با دو میلیون توکن است و این یعنی می‌تواند حجم عظیمی از داده‌ها را دریافت و درک کند. این هوش مصنوعی می‌تواند باکمک Context Window، یک ویدئوی یک‌ساعته را تجزیه و تحلیل کند.

شاید جمنای لایو در نگاه اول تفاوت چندانی با جمنای نداشته باشد؛ اما گوگل ادعا می‌کند که در جمنای لایو از تکنیک‌های جدیدتر با درصد خطای کمتر در زمینه‌ی هوش مصنوعی برای تجزیه و تحلیل دقیق‌تر تصاویر استفاده شده است.

گوگل تکنیک‌های جدیدی در زمینه‌ی هوش مصنوعی را در جمنای لایو ارائه کرده است تا به‌کمک آن‌ها موتور گفتاری پیشرفته‌تری را برای گفتگوی زنده‌ی منسجم‌تر، واقعی‌تر و با درک بهتر از احساسات کاربر ایجاد کند.

جمنای لایو به‌صورت رایگان دردسترس کاربران قرار نخواهد گرفت و بعد از انتشار در انحصار سرویس Gemini Advanced خواهد بود که برای استفاده از آن باید اشتراک Google One AI Premium را با قیمت ۲۰ دلار در ماه تهیه کرد.

مقاله رو دوست داشتی؟
نظرت چیه؟
داغ‌ترین مطالب روز
تبلیغات

نظرات