D1-lg

فیسبوک از یادگیری ماشین بدون نظارت برای ترجمه استفاد می‌کند

یک‌شنبه ۱۱ شهریور ۱۳۹۷ - ۱۴:۱۵
مطالعه 5 دقیقه
فیسبوک برای ترجمه‌ی محتوا از زبانی به‌ زبان دیگر، از یادگیری ماشین بدون نظارت استفاده می‌کند.
تبلیغات
D4-mci

هنگامی که برای ترجمه‌ی محتوا با کمک سیستم مبتنی بر هوش مصنوعی، نمونه ترجمه‌های متعدد و مختلفی در اختیار سیستم نباشد؛ و سیستم بخواهد متن را از زبانی به زبان دیگر، مثلا از زبان انگلیسی به زبان اردو ترجمه کند؛ به‌دلیل فقدان داده‌های نمونه ترجمه در سیستم، ترجمه‌ی محتوا با مشکل روبرو خواهد شد.

تیم تحقیقاتی فیسبوک، با استفاده از یادگیری ماشین بدون نظارت، برای این مساله تدبیری اندیشید و موفق شد برای ترجمه‌ی محتوا در زبان‌هایی که تعداد نمونه‌ترجمه در آنها محدود است، راهکاری پیدا کند.

فیس بوک

فیسبوک با استفاده از یادگیری ماشین بدون نظارت، می‌تواند برای زبان‌هایی که نمونه ترجمه کمتری دارند، ترجمه‌ی خوبی ارائه دهد. این پروژه توسط واحد تحقیقات هوش مصنوعی فیسبوک یا FAIR توسعه یافته است. البته FAIR در تمام مراحل کار از همکاری و مشارکت واحد Applied Machine Learning استفاده کرده است. آنتوان بوردس، کارشناس آزمایشگاه FAIR در پاریس در مصاحبه تلفنی با وب‌سایت خبری VentureBeat، به همکاری نزدیک این دو واحد تحقیقاتی برای پیشبرد پروژه اشاره کرد. در یادگیری ماشین با نظارت، ۱۰۰.۰۰۰ نمونه‌ ترجمه‌ از یک زبان به زبان دیگر وجود دارد که یادگیری بدون نظارت برای ترجمه از زبانی به زبانی دیگر که نمونه مدل ترجمه کمتری دارد، به‌کار برده می‌شود. آنتونی بوردس معتقد است:

هنگامی که می‌خواهید متنی را از انگلیسی به زبان اردو ترجمه کنید، نمونه ترجمه‌های کمتری وجود دارد؛ یادگیری ماشین بدون نظارت، در روش جدید، می‌تواند حتی عملکردی بهتر از یادگیری ماشین با نظارت را به‌نمایش بگذارد. در چنین شرایطی بدین نتیجه رسیدیم که به‌جای استفاده از یک سیستم با نظارت ولی همراه با اطلاعات کم و ناقص،  از یک سیستم بدون نظارت که آموزش دیده باشد، استفاده کنیم.
سرویس ترجمه فیس بوک

پاییز سال ۲۰۱۸ در EMNLP 2018، نتایج تلاش‌های محققان هوش مصنوعی فیسبوک، گیولام لمپل و مک‌اورلیو رانزاتو ارائه خواهد شد. بوردس معتقد است که تحقیقات انجام‌شده روی این پروژه، یکی از بهترین ایده‌هایی است که واحد FAIR از سال ۲۰۱۳ تاکنون روی آن سرمایه‌گذاری کرده است. بوردس در ادامه‌ی صحبت‌های خود اظهار داشت:

تصور کنید ما می‌توانیم با کمک این روش به سیاره‌ی دیگر برویم و با موجودات فضایی که هیچ‌کس زبان آنها نمی‌فهمد، صحبت کنیم؛ یا تصورش را بکنید که شما می‌توانید زبانی را که تاکنون هیچ‌کس بدان زبان صحبت نکرده است ترجمه کنید. با این روش، امکان ترجمه‌ی دست‌نوشته‌ها و متون باستانی و کهن که هنوز رمزگشایی نشد‌ه‌اند، امکان‌پذیر خواهد شد. این روش می‌تواند موفقیتی بزرگ در صنعت ترجمه‌ی متون از زبان‌های مختلف با کمک هوش مصنوعی و یادگیری بدون نظارت ایجاد کند که بسیار هیجان‌انگیز است.

این پروژه‌ی FAIR نیز، همانند بسیاری از پروژه‌های هوش مصنوعی این واحد، متن‌باز است و برای دانلود در گیت‌هاب قابل دسترس خواهد بود. پیشتر نیز گفته شده بود که فرآیند ترجمه در فیسبوک، توسط هوش مصنوعی انجام می‌شود. اوایل سال جاری، ترجمه‌ی متن‌باز در فیسبوک با استفاده از سیستم هوش مصنوعی برای قدرت بخشیدن به ترجمه، برای دانلود در گیت‌هاب قرار گرفت.

سیستم‌هایی مانند ترجمه‌، نیاز به تعداد زیادی داده‌های برچسب‌خورده دارند که باید به سیستم آموزش داده شوند. برای مثال، برای ترجمه از زبان فرانسوی به انگلیسی، میلیون‌ها نمونه جمله باید به سیستم داده شود تا بتواند هر دو زبان را به‌خوبی درک کند. بدین ترتیب، وقتی نمونه ترجمه‌ها در برخی زبان‌ها بسیار محدود باشد، کار ترجمه در Facebook با مشکل مواجه خواهد شد. چون تعداد جملات نمونه‌ی ترجمه‌شده در برخی زبان‌ها بسیار محدود است.

سیستم مبتنی بر هوش مصنوعی، می‌تواند سه عنصر مختلف را به‌صورت ترکیبی برای ترجمه مورد استفاده قرار دهد: ترجمه‌ی واژه به واژه، مدل‌های ترجمه و back translation. وقتی متنی از یک زبا به زبان دیگر ترجمه شود و سپس متن ترجمه‌شده مجددا به زبان اصلی برگردانده شود، بدین کار back translation گفته می‌شود.

ترجمه ماشینی

ترجمه‌ی واژه به واژه، برای پیش‌بینی کلمات براساس موضوع متن به‌کار برده می‌شود. پنج کلمه‌ی قبل و بعد کلمه‌ی مورد نظر به‌صورت واژه به واژه ترجمه می‌شود تا سیستم بتواند ترجمه‌ی کلمه‌ی مورد را مشخص کند. پاییز سال گذشته، گیولام لمپل و مک‌اورلیو رانزاتو این روش را در مقاله‌ای به‌صورت مفصل توضیح داده‌اند.

مدل‌های ترجمه، با داده‌های بسیاری از جمله کتاب‌ها یا سایر متون نوشتاری، به سیستم آموزش داده می‌شود؛ تا سیستم بتواند با کمک این داده‌ها، ترتیب کلمات در جمله و ساختار جمله را تشخیص دهد. با کمک این داده‌ها، سیستم مبتنی بر هوش مصنوعی می‌تواند زبان انگلیسی و یا اردو را متوجه شود. در نهایت، back translation، نظارتی بر ترجمه‌ی واژه به واژه و مدل‌های ترجمه خواهد داشت. روش جدید ترجمه در فیسبوک ترکیبی از سه روش را برای ارائه‌ی ترجمه‌ای خود به خدمت می‌گیرد. بوردس در ادامه‌ی صحبت‌های خود اضافه کرد:

با استفاده از این ترجمه‌ی کلمه به کلمه، سپس استفاده از مدل‌های ترجمه و در نهایت back translation، برای ترجمه زبانی به زبان دیگر، شاهد بهبود قابل‌توجهی در ترجمه خواهیم بود.

فیسبوک در نظر دارد در آینده‌ی نزدیک از سیستم مبتنی بر هوش مصنوعی، بیش از پیش برای ارائه‌ی ترجمه‌ای بهتر، استفاده کند. در این مسیر باید داده‌های بیشتری مورد بررسی قرار بگیرند و مختصصان ترجمه، بر محتوای ترجمه‌شده‌ توسط سیستم مبتنی بر هوش مصنوعی نظارت داشته باشند.

مقاله رو دوست داشتی؟
نظرت چیه؟
داغ‌ترین مطالب روز
تم‌‌ های گوشی شیائومی
بهترین تم‌‌ های گوشی شیائومی؛ از مینیمالیستی تا گیمرپسند

برای دگرگونی کامل ظاهر نرم‌افزاری دستگاه، کافی است طی چند ثانیه تم جدیدی را روی گوشی خود تنظیم کنید و تا هفته‌ها از ظاهر جدید لذت ببرید.

55
7 ساعت پیش
 افزایش کیفیت عکس با هوش مصنوعی
۸ ابزار مفید برای افزایش کیفیت عکس با هوش مصنوعی

با این ابزارهای آنلاین و آفلاین که از هوش مصنوعی کمک می‌گیرند، می‌توانید کیفیت تصاویر خود را به‌سرعت افزایش دهید.

29
4 ساعت پیش
بهترین گوشی‌های میان‌رده سامسونگ
بهترین گوشی میان رده سامسونگ [فروردین ۱۴۰۴]

در مقاله‌ی پیش‌ رو با در نظر گرفتن امکانات مناسب در مقابل قیمت مقرون‌به‌صرفه، بهترین گوشی‌های میان‌رده‌ی سامسونگ را معرفی می‌کنیم.

124
3 ساعت پیش
بهترین هندزفری های کاملا بی سیم بازار
بهترین ایرباد و هندزفری بلوتوثی در بازار ایران [فروردین ۱۴۰۴]

در مقاله‌ی پیش‌ رو بهترین هندزفری‌ها و ایربادهای کاملاً بی‌سیم بازار ایران را در بازه‌های قیمتی مختلف معرفی می‌کنیم.

304
9 ساعت پیش
بهترین گوشی‌های شیائومی
بهترین گوشی شیائومی در بازار ایران [فروردین ۱۴۰۴]

بهترین گوشی های شیائومی با ارزش خرید بالا کدام مدل‌ها هستند؟ در هر رده قیمتی چه انتظاری باید از بهترین گوشی شیائومی داشته باشیم؟

467
8 دقیقه پیش
وضعیت اینترنت
گزارش ماه مارس اسپیدتست؛ سرعت اینترنت ثابت و موبایل بالا رفت

در گزارش مارس ۲۰۲۵ اسپیدتست، ایران در جدول میانه سرعت اینترنت همراه ۴ پله صعود کرد و رتبه‌اش در جدول میانه سرعت اینترنت ثابت بدون تغییر ماند.

357
8 ساعت پیش
راهنمای خرید ساعت هوشمند
بهترین مچ بند و ساعت هوشمند بازار ایران [فروردین ۱۴۰۴]

برای رصد فعالیت‌های ورزشی و ازدست‌ندادن تماس‌ها و کنترل راحت‌تر گوشی، در این راهنمای خرید ساعت هوشمند سراغ بهترین گزینه‌های موجود در بازار رفته‌ایم.

190
یک روز پیش
تبلیغات
DN-DNShatel

نظرات

با چشم باز خرید کنید
زومیت شما را برای انتخاب بهتر و خرید ارزان‌تر راهنمایی می‌کند
ورود به بخش محصولات