گوگل فناوری تشخیص صدای خود را به کمک ردیت بهبود میبخشد
گزارشها حکایت از آن دارند که گوگل خواستار کمک کاربران ردیت برای بهبود نرمافزار تشخیص صدای خود است. به گفتهی وبسایت ورج، پیمانکارهای شخص ثالثی که توسط شرکت Appen (همکار گوگل در این زمینه)، استخدام شدهاند، با انتشار پستهایی در بخشهای مختلف وبسایت Reddit به کاربران اطلاع دادهاند که گوگل در صدد استخدام افرادی است تا در یک مدتزمان کوتاه از صدای آنها در نمونههای ضبط شده، استفاده کند. هدف نهایی گوگل از این طرح، بهبود عملکرد نرمافزار تشخیص صدای خود در درک لهجههای مختلف است. در حال حاضر نرمافزار یاد شده عملکرد مناسبی در این زمینه ندارد.
در گزارشها آمده است که پستهای یاد شده نخستینبار در سابردیت r/Edinburgh/ رویت شده است، هدف از پست یاد شده، ترغیب افراد جهت اجازه دادن به گوگل برای ضبط صدای آنها با لهجهی اسکاتلندی بوده است. پستهای مشابهی نیز برای جذب افرادی با لهجههای هندی، چینی و لهجههای متنوع آمریکایی، در سابردیتهای مختلف منتشر شده است. گفته میشود که گوگل صدای این افراد را حین بیان عبارات "Ok Google" و "Hey Google" ضبط کرده است. همچنین در بین موارد ضبط شده، پاسخ این افراد به سوالاتی در ارتباط با برنامههای تلویزیونی، اسباببازیها و بازیهای رایانهای مورد علاقهی آنها، وجود دارد.
شرکت Appen صداهای نمونهی ضبط شده را پیش از آنکه زبانشناسان شرکت یاد شده، آنها را تفسیر کنند، جمعآوری میکند. زبانشناسان احتمالا مجبور به تقسیم کردن جملات طولانی، به قطعات کوچکتری باشند تا از لحاظ گرامری قابل مدیریت بوده و به راحتی پردازش شوند. بر اساس پستهای منتشر شده در ردیت، گوگل مجموعا به ازای هر ۲۰۰۰ عبارت مبلغ ۳۵ دلار خواهد پرداخت، لازم به ذکر است که برای افراد زیر ۱۷ سال، مبلغ پرداختی ۲۶ دلار به ازای هر ۵۰۰ عبارت خواهد بود. البته ظاهرا گوگل دست داشتن خود در این فرآیند را تایید نکرده است. اگرچه گوگل با استفاده از فناوریهای یادگیری ماشینی خود، عملکرد بسیار خوبی را در زمینهی بهبود نرمافزار گفتار خود داشته، اما واضح است که این فناوری بدون وجود ابزارهای مورد نیاز برای درک لهجههای مختلف، عملکرد مناسبی نخواهد داشت. خوشبختانه به نظر میرسد که یک راهکار ساده وجود دارد تا گوگل دادههای مورد نیاز خود را به دست آورد.
نظرات