مدل هوش مصنوعی جدید گوگل می‌تواند بشنود، حرف بزند و ترجمه کند!

هوش مصنوعی

فناوری

دوشنبه ۵ تیر ۱۴۰۲ - ۰۷:۳۰

مطالعه 1 دقیقه

مجتبی بوالحسنی

گوگل مدل هوش مصنوعی جدید خود موسوم‌ به AudioPaLM را با قابلیت شنیدن، صحبت کردن و ترجمه معرفی کرد.

تبلیغات

هوش مصنوعی به‌طور مداوم در حال پیشرفت است. درحالی‌که بسیاری از افراد از هوش مصنوعی برای کمک به انجام کارهای خود بهره می‌برند، این فناوری می‌تواند بسیار کاربردی‌تر باشد. گوگل از سال‌ها قبل به‌دنبال دسترسی به ظرفیت کامل هوش مصنوعی است و جدیدترین فناوری این شرکت AudioPaLM نام دارد؛ مدلی که می‌تواند با دقت بسیار بالا گوش دهد، حرف بزند یا ترجمه کند.

محققان گوگل، AudioPaLM را به‌عنوان مدل زبان جدید معرفی کرده‌اند که می‌تواند با دقت شگفت‌انگیزی به صحبت‌های دیگران گوش داده و آن‌ها را به زبان‌های دیگر ترجمه کند. این مدل از معماری چندوجهی بهره می‌برد و نقاط قوت دو مدل کنونی یعنی PaLM-2 و AudioLM را ترکیب می‌کند.

AudioLM در حفظ اطلاعاتی مثل هویت و لحن صحبت گوینده بسیار عالی عمل می‌کند. با ترکیب این دو مدل زبانی، مدل جدید AudioPaLM به‌ دست آمد که از تخصص زبانی PaLM-2 نیز بهره می‌برد تا درک کاملی از متن و گفتار داشته باشد.

مقالات مرتبط:

به‌نوشته‌ی گیزموچاینا، AudioPaLM از واژگان مشترکی بهره می‌برد که می‌تواند گفتار و متن را با استفاده از تعداد محدودی نشانه‌های مجزا، نشان دهد؛ این قابلیت به مدل اجازه می‌دهد کارهایی مثل تشخیص گفتار، تبدیل متن به گفتار و ترجمه‌ی گفتار به گفتار را با معماری و فرایند آموزشی واحد، ارائه دهد.

AudioPaLM از سیستم‌های موجود در ترجمه‌ی گفتار بهتر عمل می‌کند و حتی می‌تواند ترجمه‌ی گفتار به نوشتار را با ترکیب‌های زبانی‌ای که قبلاً هرگز با آن‌ها مواجه نشده، انجام دهد. این هوش مصنوعی جدید می‌تواند صداها را براساس اعلان‌های گفتاری کوتاه، بین زبان‌ها انتقال دهد و صداهای متمایزی را به زبان‌های مختلف ضبط و بازتولید کند.

مقاله رو دوست داشتی؟

نظرت چیه؟

مجتبی بوالحسنی

داغ‌ترین مطالب روز

بهترین ساعت هوشمند صفحه مربعی [فروردین ۱۴۰۴]

اگر جزو آن دسته از افرادی هستید که ساعت‌های هوشمند با صفحه مربعی را ترجیح می‌دهید، در این مقاله با محصولاتی از برندهای مختلف آشنا خواهید شد.

2 روز پیش

تصویر مفهومی از لوگو اینستاگرام بر طرحی از فردی درحال فریاد

چگونه مخاطبین‌ خود را در اینستاگرام پیدا کنیم؟

پیدا کردن مخاطبین در اینستاگرام فقط یک گزینه در تنظیمات این اپلیکیشن نیست؛ در پشت‌صحنه‌ی ماجرا تکنیک‌هایی نهفته است که احتمالا آن‌ها را نمی‌دانید.

14 ساعت پیش

چه کار کنیم کرایه اسنپ کاهش پیدا کند؟

آیا می‌دانستید می‌توانید با استفاده از روش‌هایی ساده، کرایه‌ی اسنپ خود را کاهش دهید؟

296

16 ساعت پیش

بهترین گوشی های زیر ۱۵ میلیون تومان بازار

بهترین گوشی ها تا ۱۵ میلیون تومان [فروردین ۱۴۰۴]

با صرف هزینه‌ای کمتر از ۱۵ میلیون تومان، چه گوشی‌هایی در بازار ایران ارزش خرید بالایی دارند؟ در مقاله‌ی پیش‌ رو بهترین مدل‌ها را معرفی خواهیم کرد.

304

17 ساعت پیش

رویداد نادر در اقیانوس: حمله بی‌رحمانه ۶۰ نهنگ قاتل به نهنگی درمعرض انقراض

گردشگران تور گردشگری تماشای نهنگ‌ها در آب‌های استرالیای غربی شاهد حمله بی‌رحمانه گروه بزرگی از نهنگ‌های قاتل به نهنگ آبی کوتوله بودند.

14 ساعت پیش

اکشن فیگور مرد کت‌وشلوارپوش با فنجان و لپ‌تاپ

پس از تب استودیو جیبلی، ChatGPT حالا عکس شما را به عروسک‌های باربی و اکشن فیگور تبدیل می‌کند

کاربران ChatGPT پس از تب‌وتاب ساخت عکس به سبک استودیو جیبلی، حالا از این چت‌بات برای ساخت اکشن فیگور استفاده می‌کنند.

2 روز پیش

بهترین گوشی های میان رده بازار ایران [بهار ۱۴۰۴]

اگر قصد دارید بدون صرف هزینه‌ی سرسام‌آور، گوشی مناسبی بخرید، در این مقاله بهترین گوشی‌های میان‌رده‌ی بازار ایران را به شما معرفی خواهیم کرد.

329

19 ساعت پیش

نظرات