گوگل دوپلکس و نگاهی عمیقتر به قابلیتها و مسیر پیش روی این سرویس
گوگل پس از گذشت یک ماه از کنفرانس I/O و معرفی سیستم هوش مصنوعی دوپلکس خود، تعداد محدودی خبرنگار را در یک رستوران تایلندی در شمال منهتن جمع کرد تا توضیحات بیشتری در مورد عملکرد و برنامههای پیش رو برای این سرویس ارائه کند. این شرکت در جلسهی کوچک خود در این رستوران، تعداد کمی خبرنگار از رسانههای مشهور (مانند تککرانچ) را گردهم جمع کرد تا در کنار برخی کارمندان خود، قابلیتهای این سرویس را شبیهسازی کند.
این جلسه نشان داد که اهالی مانتین ویو برای ارائهی توضیحات بیشتر در مورد سرویس جدید خود، اهداف آن و عملکرد عوامل پشت صحنهی دوپلکس آماده هستند. در همان ابتدای جلسه صاحب رستوران فانتزی تایلندی در نیویورک به کارمندان گوگل و خبرنگاران گفت که این فناوری کمک شایانی به سیستم رزرواسیون آنها خواهد کرد که روزانه پذیرای بیش از ۱۰۰ تماس تلفنی رزرو هستند.
معرفی انجام شده توسط ساندار پیچای در کنفرانس ماه گذشته، بیش از توضیح در مورد Duplex، سوالات پیرامون آن را افزایش داد. اولین نگرانیها نیز در مورد ارزشهای اخلاقی شکل گرفت که توسط این سیستم زیر پا گذاشته خواهد شد. منتقدین معتقد بودند که این سرویس برای فریب دادن کارمندان کسبوکارها با این تصور که با فردی واقعی صحبت میکنند، طراحی شده است.
نکتهی قابل ذکر این که دوپلکس تنها نگاهی اولیه به پروژهای در حال اجرا توسط گوگل است. شرکتی که تاکنون بهخاطر سرّی نگاه داشتن بسیاری اطلاعات پروژهها از مردم و کاربران، سابقهی خوبی ندارد. در نتیجه شفافسازی این شرکت در مورد پروژهی در حال اجرا، کلید موفقیت آنها خواهد بود. راهحل اصلی، آزمایش واقعی قابلیتهای این سیستم است تا مانند خودروهای خودران، تمامی پیچوخمهای اجرایی آن مشخص شود.
گوگل در روز برگزاری این جلسه در یک پست وبلاگی نوشت:
ما هنوز تصمیمی برای عرضهی عمومی این قابلیت نداریم. البته با برگزاری جلسهی معرفی بیشتر قصد داریم در این مورد شفافسازی کنیم و هرگونه بازخورد از طرف کاربران و خبرنگاران را نیز با کمال میل میپذیریم. نکتهی مهم این است که تجربهی مناسب هم برای کاربران و هم برای کسبوکارها رقم بخورد. ما به آهستگی روند توسعهی این قابلیت را پیش میبریم و در این مسیر از بازخوردها و نکات دریافت شده استفاده میکنیم.
طبیعت گوگل در معرفی محصولات جدید، جلب توجه با استفاده از هر روش ممکن است. بههمین دلیل آنها دوپلکس را در کنفرانس I/O که یکی از مهمترین رویدادهای شرکت است، معرفی کردند. با این کار آنها علاوه بر قرار گرفتن در مرکز توجه، دیدی کلی نسبت به سرویس خود ارائه کردند. ساندار پیچای در زمان معرفی دوپلکس گفت: «آنچه که میشنوید، دریافت نوبت توسط دستیار گوگل است»:
دستیار گوگل: سلام، من برای تنظیم یک نوبت آرایش زنانه برای یک مشتری تماس میگیرم. ام، لطفا تاریخ سوم می را بررسی کنید.منشی: حتما، لطفا چند لحظه صبر کنید.دستیار گوگل: اوهوم.
مکث در میان مکالمه و کلمات نامفهوم، وجه تمایز دوپلکس با رقبای مشابه است
در این لحظه بود که حضار جلسه با ناباوری به پاسخ دستیار گوگل خندیدند و بلافاصله عملکرد آن را تشویق کردند. قطعا حضار از لحن پاسخگویی دستیار گوگل به وجد آمدند؛ اما در نهایت ذهن آنها، نمیتوانست قبول کند که این صدا از یک دستیار هوشمند کاملا اتوماتیک خارج میشود. کلمهی «اوهوم» مانند تزئینی روی یک محصول زیبا عمل کرد. این صداها عموما برای ایجاد وقفه و سپس ادامهی مکالمات به کار میروند. همین نکات ریز باعث شد که منشی آرایشگاه، متوجه نشود که در حال صحبت با یک ربات است.
در زبانشناسی به کلمات و عبارات مشابه «اوهوم»، اختلالات صحبت کردن میگویند که مانند مکثی در میان صحبتها استفاده میشوند. این نوع از اختلالات در صحبتهای انسانها طبیعی است و استفاده از آن در هوش مصنوعی دوپلکس، افزودنی جذابی است که آن را به محصولی قابل توجه تبدیل میکند. علاوه بر آن این عبارات نوعی راهحل مودبانه در زمان اجرای وظایف سیستم هستند.
بهعنوان مثال اگر دوپلکس با پاسخی نامشخص در زمان رزرو کردن رستوران برای میهمانی پنج نفره روبرو شود، درخواست خود را بار دیگر با کمی تغییر و استفاده از عبارتی همچون «ام، برای پنج نفر» تکرار میکند. این نوع از صحبت کردن به احتمال زیاد سردرگمی را در سمت منشی انسانی رستوران یا هر محل دیگر حل میکند و علاوه بر آن، با اضافه کردن یک بخش کوچک به صحبتها و کلمات، حس واقعی بودن آن را بیش از پیش منتقل میکند.
خبرنگار تککرانچ که در جلسهی اخیر گوگل حضور داشته اعلام میکند که این بخشهای کوچک و نامفهوم در صحبت کردن دوپلکس کاملا وجود داشتهاند. او در مورد دموهای پخش شده در رستوران تایلندی نیز میگوید که پاسخهای کاملا طبیعی و واقعی بودهاند.
بههر حال گوگل دوپلکس یک پروژهی درحال اجرا و بهبود است. یکی از نکاتی که در روز ارائهی اولیه به آن اشاره نشد، نحوهی عملکرد این سیستم در برابر قانون Two Party Consent است. این قانون در بسیاری از ایالتهای آمریکا اجرا میشود و ضبط کردن مکالمات تلفنی را تنها با کسب مجوز از هر دو طرف درگیر در مکالمه مجاز میداند. ایالتهایی همچون کنتیکت، فلوریدا، ایلینویز، مریلند، ماساچوست، مونتانا، نیوهمپشایر، پنسیلوانیا، واشنگتن و کالیفرنیا این قانون را اجرا میکنند.
مجوز ضبط مکالمه توسط هر دو طرف، یکی از چالشهای قانونی دوپلکس است
برخی کارشناسان معتقدند این چالشهای قانونی فراتر از دوپلکس هستند و بهطور کلی ماشینهای سخنگو را تحت تاثیر قرار میدهند. سوال اصلی این است که حتی در صورت موافق بودن کاربر با ضبط شدن صدا، آیا ماشین بودن یک طرف این مکالمه موجب بیاعتبار شدن قانون نخواهد شد؟ بههر حال در آینده این سرویس تنها در ایالتهای مجاز آمریکا اجرا خواهد شد اما مدیر بخش دستیار گوگل اعلام کرده که آنها تلاش میکنند عملکرد این سیستم در هر مکان، پیرو قوانین موجود در آنجا باشد.
شفافسازی عملکرد دوپلکس در ارائهی اولیه مشخص نبود؛ اما گوگل از همان ابتدا اعلام کرد که این موارد را بهمرور به سیستم اضافه خواهد کرد. البته انگیزه آنها برای اضافه کردن این موارد، تنها نگرانی از واکنشهای قانونی نبود. واکنشهایی که عموما در برابر ارتباط میان انسان و ربات ایجاد میشود. این شرکت در همان روزهای اولیهی معرفی در یک پست وبلاگی نوشت:
گوگل دوپلکس بهگونهای طراحی شده تا طبیعی به نظر برسد و تجربهی دلپذیری از مکالمه ایجاد کند. تجربهی مناسب کاربران و کسبوکارها در استفاده کردن از این سرویس، هدف نهایی ما است. برای رسیدن به این هدف، شفافسازی یکی از نیازهای اساسی است. ما میخواهیم در مورد هدف تماس شفاف باشیم تا شرکت مخاطب متوجه موضوع اصلی آن باشد. ما در ماههای آینده تجربههای جدیدی در این مورد خواهیم داشت.
سوال اصلی خبرنگاران، نوع شفافسازی پیادهسازی شده توسط این سیستم بود. یکی از سخنگوهای گوگل در پاسخ به این سوال در جلسهی اخیر گفت:
همانطور که از روز اول گفته شد، ما بحث و گفتگو و نگرانیها پیرامون گوگل دوپلکس را درک میکنیم. شفافسازی در فناوری بسیار مهم است. ما عبارتهای شفافسازی را در طراحی این سرویس لحاظ کرده و اطمینان حاصل میکنیم که سیستم، کاملا قابل شناسایی باشد. بخشی که در کنفرانس I/O نشان دادیم تنها یک دموی اولیه از فناوری بود و قطعا ما در مسیر توسعهی این سرویس، از بازخوردها استفاده خواهیم کرد.
در نسخهی کنونی دوپلکس، دستیار صوتی در ابتدای تماس خود را بهعنوان گوگل اسیستنت معرفی کرده و سپس به ضبط شدن صدا اشاره میکند. اگرچه این مکالمه اشارهای به هوش مصنوعی بودن دوپلکس نمیکند اما اگر آشنایی کلی با دستیار گوگل داشته باشید، در همان ابتدا متوجه این حقیقت میشوید. گوگل، مکالمه را بهمنظور پیادهسازی در سیستم صوت به متن و همچنین کنترل کیفیت سرویس بهمنظور پیشرفتهای آتی ضبط میکند.
نسخهی کنونی ابتدا خود را بهعنوان دستیار معرفی کرده و اعلام میکند که مکالمه ضبط میشود
در حال حاضر دوپلکس تنها یک بار در ابتدای مکالمهی تلفنی به ماشین بودن خود اشاره میکند و در صورتی که منشی متوجه این عبارت نشود، آن را تکرار نمیکند. مورد بعدی این است که تنها روش برای رد کردن درخواست ضبط مکالمه، قطع کردن آن است که البته روش مناسبی برای ارتباط با مشتری نیست. البته معاون فناوری گوگل اسیستنت، اسکات هافمن گفته که در حال پیادهسازی روندی برای حل این مسئله هستند. با پیادهسازی این راهحل، در صورت رد درخواست برای ضبط کردن مکالمه از طرف منشی، دستیار گوگل این تصمیم را پذیرفته و اعلام میکند که مکالمه ضبط نخواهد شد. البته آنها هنوز در حال تصمیمگیری بین قطع کردن تماس یا لغو سیستم ضبط مکالمه در این شرایط هستند.
در جلسهی ارائهی دمو برای خبرنگاران، اکثر آنها تلاش کردند که سیستم را دچار اشتباه کنند یا پاسخهایی خارج از عرف به دوپلکس بدهند. بههرحال در چنین مواردی دوپلکس تماس را با احترام پایان داد. در شرایط دیگر نیز که سیستم دچار سردرگمی میشد، یکی از اپراتورهای حاضر در جلسه، مدیریت آن را به دست گرفته و چالش را رفع میکرد. گوگل اعلام کرده که این اپراتورها در مراحل آزمایشی و در ابتدای عرضهی این سیستم حضور خواهند داشت تا از مشکلات احتمالی پیشگیری کنند. سوال جالب این که این گروه از اپراتورها تا پیش از پایانی شدن ارائهی دوپلکس، چند نفر خواهند شد؟
در جلسهی آزمایشی با حضور خبرنگاران، آنها موفق به کشف برخی محدودیتهای این سرویس شدند. بهعنوان مثال وقتی از دوپلکس خواسته شد که چهار رقم آخر شماره تلفن خود را تکرار کند، او کل شماره را تکرار کرد. اگرچه این مشکل، اساسی نیست اما ضعفهای کلی سیستم را در تشخیص ریزهکاریهای مکالمهی انسانی نشان میدهد. در مثالی دیگر، آدرس ایمیل از دوپلکس پرسیده شد و در پاسخ، دستیار گوگل اعلام کرد که اجازهی انشار چنین اطلاعاتی را از سمت کاربر ندارد. نکتهی دیگر این که سیستم در مواجه با منشی تلفنی و خدمات تلفن گویا دچار سردرگمی میشود.
گوگل اعلام کرده که دوپلکس در حال حاضر توانایی انجام چهار وظیفه از پنج وظیفهی اتوماتیک محول شده را دارد. این اعداد، دقت ۸۰ درصد را نشان میدهد که نسبتا خوب است اما گوگل تلاش میکند تا آمار را بهبود ببخشد. مدیر بخش دستیار گوگل میگوید که سیستم آنها باید با حداقل تلف کردن زمان کسبوکار مورد نظر عمل کند. او میخواهد کسبوکارها تجربهی مناسبی از این تماس داشته باشند و صحبت کردن با یک دستیار هوشمند، دردسری جدید در کنار چالشهای دیگر روزمرهشان نباشد.
دقت اجرای فرامین در دوپلکس در حال حاضر ۸۰ درصد پیشبینی شده است
همانطور که در روز معرفی اعلام شد، آزمایشات پیشرفته در تابستان سال جاری روی این سرویس انجام خواهد شد. مرحلهی بعدیِ تماسهای دوپلکس، سوال در مورد ساعات کاری، سپس رزرو رستوران و تنظیم وقت برای آرایشگاهها است. این مراحل با آزمایشکنندگان واقعی و گلچین شدهی گوگل انجام خواهد شد.
آمارها نشان میدهد شرکتها با اشتیاق بهدنبال این سرویس هستند. طبق اعلام گوگل بر اساس تحقیقات انجام شده در ماه آوریل، ۶۰ درصد از کسبوکارهای کوچک که خدمات نیاز به رزرواسیون ارائه میدهند، سیستم آنلاین برای این منظور ندارند. عرضه شدن دوپلکس هم برای کاربرانی که وقت برای برقراری تماس ندارند و هم این کسبوکارها مفید خواهد بود.
سیستم رزرواسیون هوشمند دوپلکس مسیری طولانی را طی کرده و امروز به آزمایشهای اولیه رسیده است. این سیستم ترکیبی از فناوریهای تبدیل صوت به متن، متن به صوت و شبکهی عصبی پردازش صوت گوگل به نام WaveNet است. اگرچه دموهای اولیهی این سیستم بر خلاف تصور عموم، زنده نبودند، اما واقعی بودند. به هر حال خبرها در این حوزه امیدوارکننده هستند و با نزدیک شدن به زمان عرضهی نهایی دوپلکس، هیجان پیرامون این سرویس روز به روز افزایش مییابد.
نظرات