فیسبوک از یادگیری ماشین بدون نظارت برای ترجمه استفاد می‌کند

یک‌شنبه ۱۱ شهریور ۱۳۹۷ - ۱۸:۴۵
مطالعه 5 دقیقه
فیسبوک برای ترجمه‌ی محتوا از زبانی به‌ زبان دیگر، از یادگیری ماشین بدون نظارت استفاده می‌کند.
تبلیغات

هنگامی که برای ترجمه‌ی محتوا با کمک سیستم مبتنی بر هوش مصنوعی، نمونه ترجمه‌های متعدد و مختلفی در اختیار سیستم نباشد؛ و سیستم بخواهد متن را از زبانی به زبان دیگر، مثلا از زبان انگلیسی به زبان اردو ترجمه کند؛ به‌دلیل فقدان داده‌های نمونه ترجمه در سیستم، ترجمه‌ی محتوا با مشکل روبرو خواهد شد.

تیم تحقیقاتی فیسبوک، با استفاده از یادگیری ماشین بدون نظارت، برای این مساله تدبیری اندیشید و موفق شد برای ترجمه‌ی محتوا در زبان‌هایی که تعداد نمونه‌ترجمه در آنها محدود است، راهکاری پیدا کند.

فیس بوک

فیسبوک با استفاده از یادگیری ماشین بدون نظارت، می‌تواند برای زبان‌هایی که نمونه ترجمه کمتری دارند، ترجمه‌ی خوبی ارائه دهد. این پروژه توسط واحد تحقیقات هوش مصنوعی فیسبوک یا FAIR توسعه یافته است. البته FAIR در تمام مراحل کار از همکاری و مشارکت واحد Applied Machine Learning استفاده کرده است. آنتوان بوردس، کارشناس آزمایشگاه FAIR در پاریس در مصاحبه تلفنی با وب‌سایت خبری VentureBeat، به همکاری نزدیک این دو واحد تحقیقاتی برای پیشبرد پروژه اشاره کرد. در یادگیری ماشین با نظارت، ۱۰۰.۰۰۰ نمونه‌ ترجمه‌ از یک زبان به زبان دیگر وجود دارد که یادگیری بدون نظارت برای ترجمه از زبانی به زبانی دیگر که نمونه مدل ترجمه کمتری دارد، به‌کار برده می‌شود. آنتونی بوردس معتقد است:

هنگامی که می‌خواهید متنی را از انگلیسی به زبان اردو ترجمه کنید، نمونه ترجمه‌های کمتری وجود دارد؛ یادگیری ماشین بدون نظارت، در روش جدید، می‌تواند حتی عملکردی بهتر از یادگیری ماشین با نظارت را به‌نمایش بگذارد. در چنین شرایطی بدین نتیجه رسیدیم که به‌جای استفاده از یک سیستم با نظارت ولی همراه با اطلاعات کم و ناقص،  از یک سیستم بدون نظارت که آموزش دیده باشد، استفاده کنیم.
سرویس ترجمه فیس بوک

پاییز سال ۲۰۱۸ در EMNLP 2018، نتایج تلاش‌های محققان هوش مصنوعی فیسبوک، گیولام لمپل و مک‌اورلیو رانزاتو ارائه خواهد شد. بوردس معتقد است که تحقیقات انجام‌شده روی این پروژه، یکی از بهترین ایده‌هایی است که واحد FAIR از سال ۲۰۱۳ تاکنون روی آن سرمایه‌گذاری کرده است. بوردس در ادامه‌ی صحبت‌های خود اظهار داشت:

تصور کنید ما می‌توانیم با کمک این روش به سیاره‌ی دیگر برویم و با موجودات فضایی که هیچ‌کس زبان آنها نمی‌فهمد، صحبت کنیم؛ یا تصورش را بکنید که شما می‌توانید زبانی را که تاکنون هیچ‌کس بدان زبان صحبت نکرده است ترجمه کنید. با این روش، امکان ترجمه‌ی دست‌نوشته‌ها و متون باستانی و کهن که هنوز رمزگشایی نشد‌ه‌اند، امکان‌پذیر خواهد شد. این روش می‌تواند موفقیتی بزرگ در صنعت ترجمه‌ی متون از زبان‌های مختلف با کمک هوش مصنوعی و یادگیری بدون نظارت ایجاد کند که بسیار هیجان‌انگیز است.

این پروژه‌ی FAIR نیز، همانند بسیاری از پروژه‌های هوش مصنوعی این واحد، متن‌باز است و برای دانلود در گیت‌هاب قابل دسترس خواهد بود. پیشتر نیز گفته شده بود که فرآیند ترجمه در فیسبوک، توسط هوش مصنوعی انجام می‌شود. اوایل سال جاری، ترجمه‌ی متن‌باز در فیسبوک با استفاده از سیستم هوش مصنوعی برای قدرت بخشیدن به ترجمه، برای دانلود در گیت‌هاب قرار گرفت.

سیستم‌هایی مانند ترجمه‌، نیاز به تعداد زیادی داده‌های برچسب‌خورده دارند که باید به سیستم آموزش داده شوند. برای مثال، برای ترجمه از زبان فرانسوی به انگلیسی، میلیون‌ها نمونه جمله باید به سیستم داده شود تا بتواند هر دو زبان را به‌خوبی درک کند. بدین ترتیب، وقتی نمونه ترجمه‌ها در برخی زبان‌ها بسیار محدود باشد، کار ترجمه در Facebook با مشکل مواجه خواهد شد. چون تعداد جملات نمونه‌ی ترجمه‌شده در برخی زبان‌ها بسیار محدود است.

سیستم مبتنی بر هوش مصنوعی، می‌تواند سه عنصر مختلف را به‌صورت ترکیبی برای ترجمه مورد استفاده قرار دهد: ترجمه‌ی واژه به واژه، مدل‌های ترجمه و back translation. وقتی متنی از یک زبا به زبان دیگر ترجمه شود و سپس متن ترجمه‌شده مجددا به زبان اصلی برگردانده شود، بدین کار back translation گفته می‌شود.

ترجمه ماشینی

ترجمه‌ی واژه به واژه، برای پیش‌بینی کلمات براساس موضوع متن به‌کار برده می‌شود. پنج کلمه‌ی قبل و بعد کلمه‌ی مورد نظر به‌صورت واژه به واژه ترجمه می‌شود تا سیستم بتواند ترجمه‌ی کلمه‌ی مورد را مشخص کند. پاییز سال گذشته، گیولام لمپل و مک‌اورلیو رانزاتو این روش را در مقاله‌ای به‌صورت مفصل توضیح داده‌اند.

مدل‌های ترجمه، با داده‌های بسیاری از جمله کتاب‌ها یا سایر متون نوشتاری، به سیستم آموزش داده می‌شود؛ تا سیستم بتواند با کمک این داده‌ها، ترتیب کلمات در جمله و ساختار جمله را تشخیص دهد. با کمک این داده‌ها، سیستم مبتنی بر هوش مصنوعی می‌تواند زبان انگلیسی و یا اردو را متوجه شود. در نهایت، back translation، نظارتی بر ترجمه‌ی واژه به واژه و مدل‌های ترجمه خواهد داشت. روش جدید ترجمه در فیسبوک ترکیبی از سه روش را برای ارائه‌ی ترجمه‌ای خود به خدمت می‌گیرد. بوردس در ادامه‌ی صحبت‌های خود اضافه کرد:

با استفاده از این ترجمه‌ی کلمه به کلمه، سپس استفاده از مدل‌های ترجمه و در نهایت back translation، برای ترجمه زبانی به زبان دیگر، شاهد بهبود قابل‌توجهی در ترجمه خواهیم بود.

فیسبوک در نظر دارد در آینده‌ی نزدیک از سیستم مبتنی بر هوش مصنوعی، بیش از پیش برای ارائه‌ی ترجمه‌ای بهتر، استفاده کند. در این مسیر باید داده‌های بیشتری مورد بررسی قرار بگیرند و مختصصان ترجمه، بر محتوای ترجمه‌شده‌ توسط سیستم مبتنی بر هوش مصنوعی نظارت داشته باشند.

مقاله رو دوست داشتی؟
نظرت چیه؟
داغ‌ترین مطالب روز
تبلیغات

نظرات