این هوش مصنوعی سخنان شما را به زبانهای مختلف ترجمه میکند
مدل هوش مصنوعی چندوجهی متا موسوم به SeamlessM4T در ماه آگوست معرفی شد که از حدود ۱۰۰ زبان برای ترجمهی متن و ۳۶ زبان برای ترجمهی گفتار پشتیبانی میکند. معماری بهروز مدل مذکور که با شناسهی v2 شناخته میشود اکنون امکان ترجمهی گفتار محاورهای را با روشی گویاتر فراهم میکند که گام بسیار مهمی برای برقراری ارتباط بین زبانهای مختلف محسوب میشود.
اولین ویژگی جدید SeamlessM4T که با نام SeamlessExpressive شناخته میشود، عبارات مورد نظر کاربر برای انتقال به گفتار ترجمهشده را تشخیص میدهد که شامل زیر و بم صدا، لحن عاطفی مثل هیجان و غم یا زمزمه، سرعت گفتار و مکث میشود.
با در نظر گرفتن اینکه سخنرانیهای ترجمهشده با کامپیوتر تاکنون خیلی رباتیک بهنظر میرسد، پیشرفت متا در این حوزه بهطور بالقوه میتواند تغییر مهمی در حوزهی ترجمه ایجاد کند که این مورد به نوبهی خود باعث ارتباط بهتر مردم سرتاسر جهان با یکدیگر و همچنین تولید محتوا خواهد شد.
براساس اطلاعات صفحهی پیشنمایش متا، هوش مصنوعی این شرکت درحالحاضر برای ترجمهی گفتار از زبانهای انگلیسی، اسپانیایی، آلمانی، فرانسوی، ایتالیایی و چینی پشتیبانی میکند.
ویژگی دوم مدل هوش مصنوعی متا SeamlessStreaming نام دارد که میتواند سخنرانیها را درحالیکه گوینده همچنان درحال صحبت است، ترجمه کند؛ بهبیان دیگر شنوندگان سریعتر ترجمهها را میشنوند و نیازی نیست صحبت گوینده حتماً بهپایان برسد. البته این ویژگی هنوز تأخیر حدود یک تا دو ثانیهای دارد ولی حداقل لازم نیست منتظر بمانید تا شخص موردنظر جملهاش را تمام کند و سپس ترجمهی آن را بشنوید.
متا میگوید چالش ترجمهی لحظهای و یکپارچه این است که زبانهای مختلف، ساختار جملهای متفاوتی دارند و بنابراین الگوریتمی را برای مطالعهی ورودی جزئی صوتی ایجاد کرده تا تصمیم بگیرد آیا زمینهی کافی برای شروع تولید خروجی ترجمهی گفتار وجود دارد یا باید همچنان به گوش دادن ادامه دهد.
بهنظر میرسد جدیدترین دستاورد متا در حوزهی هوش مصنوعی مترجم، واقعاً چشمگیر باشد و خیلی بهتر از ابزارهای مترجم کنونی مثل گوگل ترنسلیت عمل کند. هنوز نمیدانیم مترجم هوش مصنوعی متا چه زمانی دردسترس عموم قرار خواهد گرفت اما انتظار میرود ویژگی مذکور در عینکهای هوشمند ارائه شود و آنها را به محصولات کاربردیتری تبدیل کند.