آیندهای که از آن صدا است؛ چرا دستیارهای صوتی هوشمند هدف بزرگ بعدی هستند
در اکتبر ۲۰۱۶، یک مجموعه از شرکتهای بزرگ فناوری به بازدید از محصول جدید استارتاپی به نام Doppler Labs رفتند. بیل گیتس، بنیانگذار مایکروسافت و مدیرعامل آن ساتیا نادلا؛ سرپرست بخش اینترنت اپل، ادی کیو و جیمی آیوین، سرپرست گروه هدفون Beats اپل به بازدید از این نمایشگاه رفتند. قبلا هم نمایندگانی از آمازون، فیسبوک، گوگل و تنسنت به این نمایشگاه رفته بودند.
آنها با بررسی نسخههای اولیهی ایربادهای بیسیم Here One شرکت داپلر به قابلیت این دستگاه در حذف نویزهای ناخواستهی پسزمینه و قابلیتهای دیگری مثل تقویت صدای یک شخص معین در اتاق و امکان مکالمه با افراد غیر انگلیسیزبان پی بردند. برای مثال در تست زبان، یک سؤال به زبان اسپانیایی پرسیده میشود و شنونده ترجمهی کامپیوتری آن را به انگلیسی میشنود.
حداقل دو شرکت، پیشنهادهای خود را برای این محصول ارائه دادند؛ اما قیمتها قانعکننده نبودند و باعث نشدند Doppler از رویای خود برای پیادهسازی یک محصول جدید و مهم دست بردارد. فروش این کالا شکست خورد و یک سال بعد این شرکت تعطیل شد؛ اما این پایان داستان نبود. چند هفته بعد از تعطیلشدن شرکت بیش از نیمی از مهندسان ارشد Doppler به استخدام شرکتهای بزرگ فناوری درآمدند.
به گزارش Fast Company، آمازون، اپل و گوگل در حال کار روی پروژههایی در زمینهی دستیارهای صوتی هوشمند هستند. هر سه شرکت روی محصولاتی ترکیبی شامل کاربرد کمکهای شنیداری و کاربرد سرگرمی هدفونهای پیشرفته کار میکنند. ازآنجا که هر سه شرکت، طرحهای خود را برای حوزهی بهداشت و درمان اعلام کردهاند؛ میتوانند از حسگرهای نظارتی بهداشت و تناسب اندام برای اندازهگیری ویژگیهایی مثل شمردن قدمها تا اندازهگیری اشباع اکسیژن استفاده کنند. شاید چند سال زمان لازم باشد تا این برنامهها عملی شوند؛ اما هیچکدام از این شرکتها نمیخواهند عقب بمانند و هدف کلی آنها ساخت کامپیوترهای شنیداری است که بهواسطهی این فناوری، کاربر تلفن همراه خود را در کشوی میزش قرار دهد. گینتز کلیمنتز، سرپرست سابق مهندسی صوت Doppler میگوید:
ایدهی نهایی، سرقت زمان از تلفن هوشمند است. تلفن هوشمند کاملا کنار نمیرود؛ بلکه ترکیبی از دستورات صوتی و شنیداری برای انجام کارها بهکار برده میشود.
چرا دستیارهای صوتی هوشمند، چرا حالا؟
داپلر و استارتاپهای دیگر به مدت نیم دهه بهدنبال ساخت یک دستگاه شنیداری هستند و برای تسلط بر بازار روی معیارهایی مثل کیفیت صورت، عمر باتری، خنککننده و موارد دیگر تمرکز کردهاند؛ اما دلیل علاقهی ناگهانی شرکتهای بزرگ به این فناوری چیست؟ میتوان گفت دلیل اصلی، محبوبیت دستیارهای صوتی شخصی مثل Amazon Alexa، Apple Siri، Google Assistant و Microsoft Cortana است؛ پس از محبوبیت صفحهنمایش لمسی اپل و تلفن همراه آیفون، این دستیارها بزرگترین تحول در عرصهی دستیارهای صوتی کاربری هستند.
ارسال صوتی پیام در حین رانندگی خطر تصادف را کاهش میدهد
بهگفتهی کلیف راسکایند، تحلیلگر استراتژی، تمایل افراد به استفاده از فناوری بدون دست زدن به آن، سخنگوهای هوشمند را به پرطرفدارترین سختافزارهای موجود در بازار سختافزار تبدیل کرده است. تا سال ۲۰۲۳ تقریبا ۶۳ درصد از خانههای ایالات متحده مجهز به دستگاههایی مثل Amazon Echo یا Google Home خواهند شد؛ این میزان، در سال ۲۰۱۴ به ۰.۳ درصد و در سال ۲۰۱۷ به ۱۶ درصد رسیده بود.
آمریکاییها با این امکانات، دیگر نیازی به تایپ اغلب پرسوجوهای جستجوی گوگل و پیشگویی Comscore نخواهند داشت و میتوانند دستورات را بهصورت صوتی صادر کنند. بر اساس پژوهشهای ژونیپر، ارزش تبلیغات دریافتی در پاسخ به پرسوجوهای صوتی ۱۲ میلیارد دلار خواهد بود. درصورتیکه مشتریها در ساعتهای بیداری از کامپیوترهای داخل گوش استفاده کنند، دادههای شخصی بیشتری از جمله علایق و کارهای خود را در اختیار شرکتهای فناوری قرار میدهند؛ به این منظور یک کانال در مغز ایجاد میشود و خرید بهسادگی گفتن یک جمله مثل «الکسا ... را بخر» خواهد شد.
آینده به گوش وابسته است
ساتیو چاهیل، مدیر سابق بازاریابی اپل، فناوریهای شنیداری Starkey را در سالهای اخیر معرفی کرده است؛ او میگوید:
شرکتها با فناوری شنیداری میتوانند امکاناتی فراتر از تقویت موسیقی و تماس تلفنی را در اختیار کاربر قرار دهند. دستیار مجازی در کل روز در گوش کاربران زمزمه میکند؛ درعینحال میتواند سلامت و بهداشت آنها را هم بهبود دهد.
گوش، عضو ارزشمندی است که در فاصلهی چند اینچی از دهان قرار گرفته؛ بنابراین بهتر از سخنگوهای هوشمند میتواند صداها را دریافت و درک کند. گوش برخلاف چشم حتی هنگام خواب هم فعال است و میتوان آن را عضوی چندوظیفهای دانست. هرساله هزاران نفر بهدلیل ارسال پیام در حین رانندگی و حواسپرتی دچار حادثه میشوند و جان خود را از دست میدهند. اما اغلب افراد با حرف زدن در حین رانندگی و تبدیل آن به متن مشکلی ندارند (حتی اگر موسیقی در حال پخش باشد). گوشها مقابل صورت شما نیستند؛ بر همین اساس، طرحهای جدید و نامرئی جانی ایو برای دستیارهای صوتی هوشمند آینده ایدهی خوبی خواهند بود (Google Glasses را به یاد میآورید؟).
دستیارهای صوتی هوشمند با سنسورها و پردازش مناسب تشخیص میدهند که سر شما به سمت قفسهی یک فروشگاه قرار گرفته یا به سمت یک بیلبورد داخل خیابان. بهگفتهی پاپی کرام، سرپرست علمی آزمایشگاههای دالبی، با اضافه شدن ناظر ضربان قلب برای اندازهگیری استرس و حسگر نوار مغزی برای تحلیل فعالیتهای مغزی، این دستیارهای صوتی میتوانند تا اندازهای افکار شما را توصیف کنند؛ برای مثال میتوانند بگویند توجه شما تا چه اندازه به صدای قدمهای پشت سرتان جلب شده است.
ادراک و قابلیتهای دستیارهای صوتی هوشمند در آینده حتی از کلماتی که به زبان میآورید، فراتر خواهد رفت. در حال حاضر یک استارتاپ بریتانیایی در کمبریج به نام Audio Analytic در تلاش برای دریافت مجوز نوعی دستگاه است که صداهایی مثل شکستن پنجره یا گریهی نوزاد را تشخیص میدهد. البته اخیرا آمازون با تشخیص صدای سرفه تبلیغات Robitussin را ارسال میکند که یک نوع دارو برای سرماخوردگی است.
چالش شنیداری
گوش و دستیارهای صوتی، مشکلات جدیدی را برای شرکتهای عرضهکنندهی محصولات محاسباتی بهوجود خواهند آورد. دستگاههای محاسباتی شنیداری کوچک و سبک هستند که میتوانند به مدت طولانی و بدون آزار برای کاربر در مجرای گوش او قرار بگیرند. البته قدرت باطری این دستگاهها باید به اندازهی تلفن هوشمند باشد و تا وقتی تلفن همراه روشن است به فعالیت خود ادامه دهند. بدیهی است که نیاز به یک آنتن و پردازندهی قوی را نباید نادیده گرفت. البته دو چالش دیگر وجود دارند: یکی جرم گوش و دیگری استفاده از دستگاههای شنیداری بدون لرزش سر یا دست، ضربه خوردن به گوش و حتی حرف زدن با خود (بقیه فکر کنند شخص با خود حرف میزند). بر اساس بررسیهای اخیر، تنها ۶ درصد از آمریکاییها برای صحبت با دستیار صوتی خود در ملاء عام احساس راحتی میکنند.
یک تصور نادرست دیگر هم در مورد سمعکها وجود دارد. به نقل از انجمن کمبود شنوایی بااینکه صدها میلیون نفر به سمعک نیاز دارند؛ از میان ۴۸ میلیون نفر آمریکایی که به سمعک نیاز دارند، تنها ۱۶ درصد اقدام به خرید آن میکنند. افرادی هم که آن را میخرند، معمولا پس از مدت میانگین هفت سال کنار میگذارند.
مقررات این صنعت بیفایده بوده است؛ به این دلیل که سمعکها یا کمکهای شنیداری، دستگاههایی پزشکی هستند و در درجهی اول به تصویب وزارت غذا و دارو نیاز دارند و مشتریان هم با تشخیص پزشک و شنواییسنج (بدون پوشش بیمه) میتوانند از آنها استفاده کنند. به گزارش Consumer Report بر اساس نسبت حاشیهی سود به رشد فروش، پنج شرکت میتوانند در طول یک سال بر بازار ۶ میلیارد دلاری سمعکها مسلط شوند و محصولاتی با ارزش میانگین ۲۷۰۰ دلار را به فروش برسانند. قیمت بهترین نوع سمعک هم ۱۰٬۰۰۰ دلار خواهد بود.
حال این قانون در حال کمرنگ شدن است. آگوست سال گذشته، کنگره قانون کمکهای شنیداری OTC را تصویب کرد. وقتی این قانون در آگوست ۲۰۲۰ تصویب شود، شرکتها میتوانند برای افراد با اختلال شنوایی کم تا متوسط به تولید سمعک و کمکهای شنیداری بپردازند و آن را در هر داروخانهای عرضه کنند. در گذشته، تولیدکنندگان عینک برای افرادی که قصد مراجعه به چشمپزشک را نداشتند دست به تولید قرائتگرهای ده دلاری زدند.
به این ترتیب این دستگاهها بازار بزرگ و روبهرشدی را خواهند داشت. بهگفتهی سازمان سلامت جهانی، ۱.۱ میلیارد کودک و جوان بالغ در سراسر دنیا در معرض خطر از دست دادن شنوایی قرار دارند، آنها مرتب از ایرفونهایی با محدودهی صدای بسیار بالا و مستقیم استفاده میکنند.
این قانون تأثیر چشمگیری خواهد داشت. اگر بعد از شنیدن هر سخنی از طرف مقابل پرسیدید «چی؟» بهتر است فکری برای حل این مشکل کنید. بهاحتمالزیاد، شرکتهای عرضهکننده این دستگاه را در دستهی وسایلی مثل کاورهای رنگارنگ آیفون و فیتبیتها قرار میدهند؛ نه در دستهی Depends و دیگر محصولات مرتبط با افراد میانسال. این دستگاه نباید با عنوان سمعک بازاریابی و تبلیغ شود، بلکه باید بهعنوان ایرفون بلوتوث با امکاناتی مثل «بهبود شنیداری» یا شخصیسازی عرضه شود.
کی آر لیو، معاون سابق دسترسی داپلر میگوید تقریبا برای بیست سال منتظر این لحظه بوده است؛ او تنها سه سال داشت که از سمعک برای مبارزه با زوال شدید شنوایی خود استفاده کرده بود. به عقیدهی او، با قدرت بالای شرکتها در زمینهی برندسازی میتوان تصورات غلط را نسبت به سمعکها و دستیارهای صوتی هوشمند از بین برد.
تأثیر داپلر
داپلر، دستیار صوتی هوشمند را اختراع نکرد؛ بلکه در دورهی کوتاه فعالیت خود توانست نفوذ و تأثیرگذاری آن را بالا ببرد. یکی از مدیران صنعت موسیقی نوآ کرفت و مدیر سابق مایکروسافت، فریتز لانمان، داپلر را در سال ۲۰۱۳ تأسیس کردند؛ تا محصولی را برای فستیوال Coachella بهمنظور سفارشیسازی موسیقی زنده با امکاناتی مثل افکت fuzz یا قرار دادن حد بالاتری روی حجم صوت عرضه کنند. در اوایل ۲۰۱۶، تیمی قوی از کارشناسان صوتی روی Here One کار کردند که از امکانات صوتی و همینطور توانایی تماس تلفنی و موزیک استریم برخوردار بود.
پس از توسعهی محصولات، داپلر از طرف شرکتهای بزرگ فناوری علاقهمند، پیشنهادهایی را دریافت کرد. اگرچه قرار بود Here One در طی چند ماه به بازار عرضه شود؛ کرافت، مدیرعامل شرکت اعلام کرد اکتبر نسخهی دمو ارائه خواهد شد. یک تیم کوچک فروشگاهی را در یک اتاق کنفرانس مجلل در دفتر Universal Music Group (یکی از اولین سرمایهگذاران Doppler) ترتیب دادند.
بازدیدکنندگان شامل سرمایهگذارهای اقتصادی مثل مری میکر و یوری میلنر و تیمهایی از آمازون و واحد R&D آن در سیلیکونولی و همینطور Lab 126، گوگل، اپل و فیسبوک بودند. با اینکه چند شرکت پیشنهادهای خود را روی میز گذاشتند، اما هیچکدام نتوانستند نظر کرافت و هیئتمدیرهی داپلر را به خود جلب کنند.
پس از به فروش گذاشتن Here One، تمام رؤیاپردازیهای افسانهای این محصول از بین رفتند. مطبوعات فناوری این دستگاه را بهخاطر طراحی نوآورانهی آن مورد تحسین قرار دادند؛ اما مشکلاتی مثل طول عمر باتری و بیسیم نبودن ایرفون فروش پائین آن را بهدنبال داشت. البته یک نقطهی روشن هم وجود داشت. تقریبا یکچهارم خریدارها با قیمتی کمتر این دستگاه را خریدند و آن را جایگزین واسطههای قدیمی خود کردند؛ البته داپلر هم زیاد برای بازاریابی محصول تلاش نکرده بود. پس از آنکه ایرپاد اپل بازار ایرفون را به تسخیر خود درآورد، داپلر تصمیم گرفت مسیر خود را تغییر دهد. درحالیکه تیم مهندسی بر قابلیت شنیداری متمرکز بود، لیو بهدنبال لابیگری برای فروش بدون نسخهی محصول (OTC) بود.
نوآ کرافت (سمت راست بالا) و تیم آزمایشگاه داپلر. هفت نفر از این تیم حالا در آمازون کار میکنند، سه نفر در اپل، سه نفر در گوگل و سه نفر دیگر هم در دالبی مشغول به فعالیت هستند
تا آگوست سال گذشته که این طرح قانونی شد، داپلر در وضعیت بدی قرار داشت. کرافت مجددا با پیشنهاددهندگان بالقوه تماس گرفت و آنها هم بلافاصله درخواست ملاقات را پذیرفتند. یک تیم از مایکروسافت ازجمله مدیرعامل آن، نادلا به بررسی تأثیر دستگاههای شنیداری بر بهرهوری کارکنان پرداختند. شرکتها در مورد ایدههای جذابی به همکاری با یکدیگر پرداختند. از آنجا که Here One مجهز به یک میکروفون داخلی برای تقویت صدای کاربر بود، استفاده از آن برای صدور دستورات ورد و اکسل ایدهی خوبی بود؛ اما در پایان مایکروسافت تصمیم گرفت این پیشنهاد را نادیده بگیرد. تیمهای مختلفی از گوگل ازجمله یک نفر از X moonshot factory و یک نفر از بخش سختافزار که بهدنبال تکمیل پیکسل بادها بودند هم به بررسیهای خود ادامه دادند؛ اما هیچ کدام پیشنهاد قابلتوجهی را ارائه ندادند.
در سپتامبر ۲۰۱۷، اپل تیم بزرگی را برای مذاکرهی بیشتر ارسال کرد. واضح بود که اپل نیازی به داپلر نداشت؛ زیرا از سال ۲۰۱۱ یعنی زمانی که با سازندگان سمعکها و کمکهای شنیداری به همکاری میپرداخت، روی فناوری شنیداری کار میکرد و فناوری را ارائه داد که بهواسطهی آن مصرفکنندگان میتوانستند صدای ضبطشدهی میکروفون آیفون خود را بهصورت مستقیم به سمعک خود انتقال دهند (برای مثال یک دانشآموز میتوانست آیفون خود را نزدیک به معلم و در مقابل کلاس قرار دهد تا سخنرانی را بهخوبی بشنود).
با فناوری شنیداری آمازون میتوان مستقیما از طریق الکسا خرید کرد
این شرکت، سرمایهی زیادی را صرف ساخت یک فناوری مشابه تراشهی ارتباطی W1 کرد؛ که از نظر کیفیت صوت، عمر باتری و سهولت کاربرد به ساخت ایرپاد کمک میکرد. به نقل از گروه NPD، ایرپادها ۲۴ درصد از فروش ایرفون بیسیم را در نیمهی اول امسال از آن خود کردند (۳ درصد بیشتر از هدفونهای Beats). البته اپل هنوز هم به خرید فناوریهای کلیدی داپلر بهویژه فناوریهای مرتبط با الگوریتمهای شنیداری علاقهمند بود؛ اما مبلغ پیشنهادی آن نتوانست نظر داپلر را جلب کند.
با دستیار صوتی هوشمند قدرتمند آمازون، کاربرها میتوانند از طریق الکسا (حتی اگر نزدیک به گویندهی هوشمند نباشند) و بدون وابستگی به دستگاه اندروید یا iPhone خود خرید کنند. تیم Lab 126 به مدت سالها روی پروژهی خارج کردن الکسا از محیط خانه کار میکرد. فروشندگان آمازون پس از اطلاع از رکورد مالی سریع داپلر (همینطور اطلاع از فناوری داپلر و مذاکرههای تجاری) قیمت پائینی را برای مزایده پیشنهاد دادند.
کرافت بهجای پذیرش پیشنهادها، تصمیم گرفت چند هفته بعد، شرکت را کاملا تعطیل کند. او بعدها دارایی داپلر را به دالبی فروخت. شرکت دالبی در زمینهی نرمافزارهای صوتی و بهبود صوت فیلمها و رسانههای دیگر تخصص دارد. دالبی هیچ محصول جدیدی را بر اساس مجوزهای داپلر تأیید نکرد؛ اما کرام، سرپرست علمی این شرکت میگوید:
در حال حاضر بر شناسایی نحوهی ارتباط فناوری، اکوسیستمها و دانش خود با بازار شنیداری کار میکنیم. فناوری داپلر با وجود تعطیلی این شرکت توانست به حیات خود ادامه دهد. ما به محصول خود و تیم داپلر برای توسعهی فناوری کامپیوتر داخل گوش افتخار میکنیم.
آینده
داپلر از میدان خارج شده است، اما علائم حیاتی بازار شنیداری روزبهروز قویتر میشوند. دستمزد فناوریهای صوتی بالا رفته است؛ بهطوریکه شرکتهای بزرگ فناوری معمولا ۲۰۰ هزار دلار را به استعدادهای برتر استارتاپها و شرکتهای فعال در زمینهی شنیداری میپردازند. کوالکام بهعنوان یک شرکت بزرگ در زمینهی تولید تراشهی موبایل، اولین گروه تراشهی خود برای واسطههای شنیداری را در ماه مارس معرفی کرد و انتظار میرود شرکتهای دیگر تا پایان سال این راه را دنبال کنند.
آمازون، گوگل و اپل آمادگی خود را در این زمینه حفظ کردهاند. به نقل از سه کارمند سابق داپلر، آمازون همزمان با مذاکره با داپلر در سال گذشته با تیمی شامل ۷۰ کارمند روی دستگاههای شنیداری کار میکرد. درحالیکه تیم سختافزاری گوگل روی پیکسل بادز و محصولات دیگر کار میکند؛ واحد X گوگل بهدنبال توسعهی کامپیوترهای کاملا مستقل داخل گوش است و بخش Google Voice هم در مورد روشهایی برای دستیار شخصی به پژوهش میپردازد که دسترسی به آنها از دستیارهای صوتی هوشمند امکانپذیر باشد.
اپل نیز به روش خود پیشتاز است. به نقل از منابع این شرکت بهجای ساخت یک محصول انقلابی و کاملا جدید در عصر شنیداری، بهدنبال اضافه کردن قابلیتها و امکانات جدید و آشنا برای کاربر است. به نقل از بلومبرگ، این شرکت تا پایان سال هدفونهای پیشرفتهای را برای دوستداران موسیقی معرفی میکند و علاوهبر این، به عرضهی یک نسخهی ارتقاءیافته و مقاوم در برابر آب ایرپاد میپردازد که با جملهی «Hey Siri» فعال میشود.
دیگر شرکتهای پیشتاز در این فناوری خود را برای عرضهی محصولات جدید خود آماده میکنند. براگی شرکتی آلمانی است که کمی قبلتر از داپلر تأسیس شده و اخیرا بهدنبال دریافت مجوز نرمافزارش، فروش دستگاههای شنیداری خود را متوقف کرده است. مدیرعامل این شرکت نیکولاج هیوید میگوید:
وقتی اپل و شرکتهای دیگر بهدنبال شما حرکت کنند، باید محل سرمایهگذاری خود را تغییر دهید. از سوی دیگر، داشتن اینهمه همراه و دنبالهرو جذاب است.