ربات تشخیص گفتار مایکروسافت به دقتی مشابه انسان رسیده است
تیمی از مهندسان مایکروسافت که در زمینه ی هوشمصنوعی و تحقیقات مرتبط با آن فعالیت میکنند، گزارش دادهاند که ربات تشخیص گفتار این شرکت به درصد خطایی معادل ۵.۹ رسیده است. این خطا تقریبا مشابه تواناییهای یک انسان است.
ژدونگ هوانگ، دانشمند ارشد تشخیص گفتار مایکروسافت، اعلام کرده است که «این شرکت با تواناییهای یک انسان به برابری رسیده و به دستاوردی تاریخی دست پیدا کرده است».
پس از دههها آزمون و خطا، مایکروسافت توانسته خطای ۶.۳ درصد (که ماه گذشته بدست آورد) را بهبود بخشد. این موفقیت میتواند رقابت شرکتهای تکنولوژی برای تصاحب بازار دستیارهای دیجیتال را پیچیدهتر کند. همچنین محصولات مختلف مایکروسافت از جمله کورتانا، اکسباکس و ویندوز میتوانند از این تکنولوژی به نفع خود استفاده کنند.
برای دستیابی به این دقت، پژوهشگران مایکروسافت شبکههای عصبی عمیق را به کار گفتهاند تا با ارائهی میزان بسیار گستردهای از دیتا (یا به عبارتی ستهای تمرینی)، به سیستم کمک کنند که الگوی گفتار انسان را با دقت بالاتری فرا گیرد. مایکروسافت از صدا و تصویر برای استفادهی بهتر از این دیتاها و بالابردن بازده آزمایش خود استفاده کرده است.
با وجود این دستاورد، پژوهشگران اشاره میکنند که شباهت به انسان با بینقص بودن تفاوت زیادی دارد. نباید فراموش کنیم که انسانها نیز در تشخیص گفتار اشتباههای زیادی دارند.
اعضای این تیم امیدوارند که در آینده به سطحی بالاتر از دقت تشخیص گفتار دست یابند و بتوانند درصد خطای دستگاه خود را در موقعیتهای واقعی (مانند رستورانهای شلوغ و شرایط جوی نامساعد) بهبود ببخشند. اعضای این تیم امیدوارند به سیستمی دست یابند که نه تنها گفتار را تشخیص میدهد؛ بلکه آن را درک و تحلیل خواهد کرد.
با اینکه هنوز از رسیدن به این هدف فاصلهی زیادی داریم. اما در آینده نیازی نیست که انسانها به دنبال یادگیری کامپیوترها باشند؛ بلکه آنها رفتارهای ما را فرا خواهند گرفت.
نظرات