فیسبوک از یادگیری ماشین بدون نظارت برای ترجمه استفاد میکند
هنگامی که برای ترجمهی محتوا با کمک سیستم مبتنی بر هوش مصنوعی، نمونه ترجمههای متعدد و مختلفی در اختیار سیستم نباشد؛ و سیستم بخواهد متن را از زبانی به زبان دیگر، مثلا از زبان انگلیسی به زبان اردو ترجمه کند؛ بهدلیل فقدان دادههای نمونه ترجمه در سیستم، ترجمهی محتوا با مشکل روبرو خواهد شد.
تیم تحقیقاتی فیسبوک، با استفاده از یادگیری ماشین بدون نظارت، برای این مساله تدبیری اندیشید و موفق شد برای ترجمهی محتوا در زبانهایی که تعداد نمونهترجمه در آنها محدود است، راهکاری پیدا کند.
فیسبوک با استفاده از یادگیری ماشین بدون نظارت، میتواند برای زبانهایی که نمونه ترجمه کمتری دارند، ترجمهی خوبی ارائه دهد. این پروژه توسط واحد تحقیقات هوش مصنوعی فیسبوک یا FAIR توسعه یافته است. البته FAIR در تمام مراحل کار از همکاری و مشارکت واحد Applied Machine Learning استفاده کرده است. آنتوان بوردس، کارشناس آزمایشگاه FAIR در پاریس در مصاحبه تلفنی با وبسایت خبری VentureBeat، به همکاری نزدیک این دو واحد تحقیقاتی برای پیشبرد پروژه اشاره کرد. در یادگیری ماشین با نظارت، ۱۰۰.۰۰۰ نمونه ترجمه از یک زبان به زبان دیگر وجود دارد که یادگیری بدون نظارت برای ترجمه از زبانی به زبانی دیگر که نمونه مدل ترجمه کمتری دارد، بهکار برده میشود. آنتونی بوردس معتقد است:
هنگامی که میخواهید متنی را از انگلیسی به زبان اردو ترجمه کنید، نمونه ترجمههای کمتری وجود دارد؛ یادگیری ماشین بدون نظارت، در روش جدید، میتواند حتی عملکردی بهتر از یادگیری ماشین با نظارت را بهنمایش بگذارد. در چنین شرایطی بدین نتیجه رسیدیم که بهجای استفاده از یک سیستم با نظارت ولی همراه با اطلاعات کم و ناقص، از یک سیستم بدون نظارت که آموزش دیده باشد، استفاده کنیم.
پاییز سال ۲۰۱۸ در EMNLP 2018، نتایج تلاشهای محققان هوش مصنوعی فیسبوک، گیولام لمپل و مکاورلیو رانزاتو ارائه خواهد شد. بوردس معتقد است که تحقیقات انجامشده روی این پروژه، یکی از بهترین ایدههایی است که واحد FAIR از سال ۲۰۱۳ تاکنون روی آن سرمایهگذاری کرده است. بوردس در ادامهی صحبتهای خود اظهار داشت:
تصور کنید ما میتوانیم با کمک این روش به سیارهی دیگر برویم و با موجودات فضایی که هیچکس زبان آنها نمیفهمد، صحبت کنیم؛ یا تصورش را بکنید که شما میتوانید زبانی را که تاکنون هیچکس بدان زبان صحبت نکرده است ترجمه کنید. با این روش، امکان ترجمهی دستنوشتهها و متون باستانی و کهن که هنوز رمزگشایی نشدهاند، امکانپذیر خواهد شد. این روش میتواند موفقیتی بزرگ در صنعت ترجمهی متون از زبانهای مختلف با کمک هوش مصنوعی و یادگیری بدون نظارت ایجاد کند که بسیار هیجانانگیز است.
این پروژهی FAIR نیز، همانند بسیاری از پروژههای هوش مصنوعی این واحد، متنباز است و برای دانلود در گیتهاب قابل دسترس خواهد بود. پیشتر نیز گفته شده بود که فرآیند ترجمه در فیسبوک، توسط هوش مصنوعی انجام میشود. اوایل سال جاری، ترجمهی متنباز در فیسبوک با استفاده از سیستم هوش مصنوعی برای قدرت بخشیدن به ترجمه، برای دانلود در گیتهاب قرار گرفت.
سیستمهایی مانند ترجمه، نیاز به تعداد زیادی دادههای برچسبخورده دارند که باید به سیستم آموزش داده شوند. برای مثال، برای ترجمه از زبان فرانسوی به انگلیسی، میلیونها نمونه جمله باید به سیستم داده شود تا بتواند هر دو زبان را بهخوبی درک کند. بدین ترتیب، وقتی نمونه ترجمهها در برخی زبانها بسیار محدود باشد، کار ترجمه در Facebook با مشکل مواجه خواهد شد. چون تعداد جملات نمونهی ترجمهشده در برخی زبانها بسیار محدود است.
سیستم مبتنی بر هوش مصنوعی، میتواند سه عنصر مختلف را بهصورت ترکیبی برای ترجمه مورد استفاده قرار دهد: ترجمهی واژه به واژه، مدلهای ترجمه و back translation. وقتی متنی از یک زبا به زبان دیگر ترجمه شود و سپس متن ترجمهشده مجددا به زبان اصلی برگردانده شود، بدین کار back translation گفته میشود.
ترجمهی واژه به واژه، برای پیشبینی کلمات براساس موضوع متن بهکار برده میشود. پنج کلمهی قبل و بعد کلمهی مورد نظر بهصورت واژه به واژه ترجمه میشود تا سیستم بتواند ترجمهی کلمهی مورد را مشخص کند. پاییز سال گذشته، گیولام لمپل و مکاورلیو رانزاتو این روش را در مقالهای بهصورت مفصل توضیح دادهاند.
مدلهای ترجمه، با دادههای بسیاری از جمله کتابها یا سایر متون نوشتاری، به سیستم آموزش داده میشود؛ تا سیستم بتواند با کمک این دادهها، ترتیب کلمات در جمله و ساختار جمله را تشخیص دهد. با کمک این دادهها، سیستم مبتنی بر هوش مصنوعی میتواند زبان انگلیسی و یا اردو را متوجه شود. در نهایت، back translation، نظارتی بر ترجمهی واژه به واژه و مدلهای ترجمه خواهد داشت. روش جدید ترجمه در فیسبوک ترکیبی از سه روش را برای ارائهی ترجمهای خود به خدمت میگیرد. بوردس در ادامهی صحبتهای خود اضافه کرد:
با استفاده از این ترجمهی کلمه به کلمه، سپس استفاده از مدلهای ترجمه و در نهایت back translation، برای ترجمه زبانی به زبان دیگر، شاهد بهبود قابلتوجهی در ترجمه خواهیم بود.
فیسبوک در نظر دارد در آیندهی نزدیک از سیستم مبتنی بر هوش مصنوعی، بیش از پیش برای ارائهی ترجمهای بهتر، استفاده کند. در این مسیر باید دادههای بیشتری مورد بررسی قرار بگیرند و مختصصان ترجمه، بر محتوای ترجمهشده توسط سیستم مبتنی بر هوش مصنوعی نظارت داشته باشند.
نظرات