چگونه اپل صدای انسانی‌تری برای سیری طراحی کرد

یک‌شنبه ۱۹ شهریور ۱۳۹۶ - ۱۲:۰۰
مطالعه 14 دقیقه
آی‌اواس ۱۱، در کنفرانس امسال توسعه‌دهندگان اپل به همراه نسخه‌ای بهبودیافته از سیری معرفی شد. اما اپل چگونه موفق به ایجاد تغییرات اساسی در دستیار صوتی خود شد؟
تبلیغات

سیری، الکسا، کورتانا، گوگل اسیستنت و دیگر دستیارهای صوتی مجازی با اینکه هنوز در مراحل ابتدایی تکامل خود به‌ سر می‌برند، اما امروزه نقش زیادی در زندگی‌ روزمره‌ی ما بازی می‌کنند. آن‌ها در گوشی‌های موبایل ما، اسپیکر‌های هوشمند، پلتفرم‌های اینترنت اشیاء و ... حضور فعالی دارند و انجام امور مختلف را برای ما آسان می‌کنند. در این میان سیری، دستیار صوتی کهنه‌کار اپل در نسخه‌ی بعدی سیستم عامل موبایل این شرکت یعنی آی‌اواس ۱۱، با بهبودهای فراوانی به‌روزرسانی شده است. سیری جدید تا چند هفته‌ی آینده، به همراه نسخه‌ی نهایی آی‌اواس ۱۱ و آیفون ۸ به‌صورت رسمی در اختیار کاربران قرار خواهد گرفت. به همین مناسبت دیوید پیرس، نویسنده‌ی ستون فناوری وب‌سایت وایرد، به سراغ مدیران ارشد اپل و در راس آن‌ها الکس ایسرو رفته و از آن‌ها درباره‌ی رازهای ناگفته درباره‌ی تکامل سیری پرسش‌های قابل تأملی کرده است. حاصل این پرسش و پاسخ، مقاله‌‌ی ذیل است که در تاریخ هفتم سپتامبر در وب‌سایت وایرد منتشر شده است.

کپی لینک

سیری در برابر سامانتا

هنگامی که الکس ایسرو برای اولین بار فیلم او (Her) را تماشا کرد، همانند افراد معمولی از ابتدا تا انتها به صفحه‌ی نمایشگر چشم دوخت. اما دفعه‌ی دومی که وی به مشاهده‌ی این فیلم پرداخت، در واقع اصلا فیلم را تماشا نکرد. ایسرو، مدیر ارشد اپل و مسئول توسعه‌ی دستیار صوتی سیری، روبه‌روی نمایشگر نشست، چشمان خود را بست و به نحوه‌ی صحبت کردن اسکارلت جوهانسون در نقش یک هوش مصنوعی به نام سامانتا گوش سپرد. او به نحوه‌ی برقراری ارتباط متقابل بین سامانتا و تئودور توامبلی با بازی حواکین فینیکس توجه کرد. ایسرو تلاش کرد تا دریابد چه چیزی در مورد سامانتا توانسته است منجر به بروز علاقه‌ی شدید بازیگر نقش اول مرد به وی، بدون دیدنش شود.

هنگامی که نظر ایسرو را درباره‌ علت موفقیت این صدا جویا شدم، وی با خنده پاسخ داد زیرا جواب این سؤال بسیار واضح بود. ایسرو در پاسخ گفت: «صدای او (سامانتا) طبیعی است! صدای او رباتیک نیست!» این موضوع غیر قابل فهمی برای ایسرو نبود. در همین راستا، تأیید شد که تیم او در اپل، سال‌های اخیر را صرف انجام یک پروژه‌ کرده است؛ انسانی‌تر کردن صدای سیری.

پاییز امسال، زمانی که آی‌اواس ۱۱ برای میلیون‌ها دستگاه آیفون و آیپد در سراسر جهان منتشر شود، این به‌روزرسانی نرم‌افزاری، یک صدای جدید برای سیری به ارمغان خواهد آورد. این ارتقاء پیش‌ رو، شامل ویژگی‌های جدید یا قابلیت تعریف لطیفه‌های خنده‌دارتر نیست؛ اما تغییرات صورت‌گرفته در سیری برای کاربران قابل درک خواهد بود. سیری اکنون حین ادای جملات مکث بیشتری می‌کند؛ درست پیش از هر مکث، هجاها را می‌کشد؛ آهنگ صدای خود را حین صحبت بالا و پایین می‌برد و واژه‌ها را روان‌تر تلفظ می‌کند. سیری همچنین قادر به صحبت به زبان‌های بیشتری خواهد بود. مجموع این بهبودها، تعامل با دستیار صوتی اپل را لذت‌‌بخش‌تر خواهد کرد.

اپل سال‌های زیادی صرف بازسازی ساختار فناوری سیری و تغییر ماهیت آن از یک دستیار مجازی به یک هوش مصنوعی همه‌کاره و مبتنی بر موبایل و قرار دادن آن در اختیار کشورها و زبان‌های بیشتری کرده است. سیری با وجود تمام نواقصش، دردسترس‌ترین دستیار صوتی جهان است. تلاش‌های اپل به‌منظور در اختیار قرار دادن سیری برای افراد بیشتر، در ابتدا آهسته بود، اما اکنون سرعت بیشتری به خود گرفته است. سیری اکنون تحت نظارت کریگ فدریگی، رئیس بخش نرم‌افزاری اپل قرار دارد این موضوع نشان‌دهنده‌ی اهمیت یافتن این دستیار صوتی برای اپل در حد سیستم‌عامل ‌آی‌اواس است.

iBrain Apple

فناوری هنوز به آن اندازه پیشرفت نکرده است که شما را عاشق دستیار مجازی‌تان کند. اما ایسرو و تیم او معتقدند که با اقدامات خود قدم رو به جلوی بزرگی برداشته‌اند. آن‌ها شدیدا بر این باورند که اگر موفق به انسانی‌تر کردن صدای سیری شوند و آن را شبیه به یک فرد آشنا و قابل اعتماد کنند، حتی در صورت شکست، از سیری یک هوش مصنوعی بی‌نظیر خواهند ساخت. این اقدام، در دوران اولیه‌ی تکامل فناوری هوش مصنوعی مبتنی بر صدا، احتمالا بهترین سناریوی ممکن خواهد بود.

کپی لینک

سیری تکامل می‌یابد

اگر یک مثال خوب از علت کنترل اپل بر تمام جنبه‌های محصولاتش می‌خواهید، کافی است به سیری نگاه کنید. سیری ۶ سال پس از عرضه‌، در اغلب ویژگی‌ها از سایر رقبای خود عقب مانده است. الکسای آمازون، پشتیبانی بیشتری از توسعه‌دهندگان فراهم می‌کند؛ گوگل اسیستنت چیزهای بیشتری می‌داند و هر دوی آن‌ها در دستگاه‌های بیشتری که توسط کمپانی‌های مختلف ساخته شده‌اند، قابل دسترسی هستند.

اپل خود را در این جریان مقصر نمی‌داند. زمانی که سیری برای اولین بار منتشر شد، کمپانی دیگری مسئول فراهم کردن فناوری تشخیص صدای آن بود. بنابراین، تمام تقصیرها متوجه این کمپانی (شرکت نیوانس) است؛ با این وجود نه اپل و نه نیوانس هرگز همکاری خود را با یکدیگر تأیید نکردند. مقصر هرکس که بود، اپل اکنون با خوشحالی مشکلات اولیه‌ی سیری را به گردن نیوانس می‌اندازد. گرک جوزویاک، نائب‌رئیس بخش بازاریابی اپل؛ می‌گوید:

این موضوع مثل این می‌ماند که با پشتیبانی شخص دیگری در یک رقابت شرکت کنید... اپل همیشه برنامه‌های بزرگی برای سیری در سر داشت. ما در فکر این بودیم که دستیاری بسازیم تا بتوانید به‌وسیله‌ی گوشی خود با آن صحبت کنید و با استفاده از آن کارهای خود را به نحو ساده‌تری به انجام برسانید. اما در آن زمان، فناوری هنوز پیشرفت لازم را پیدا نکرده بود. زمانی که ورودی مناسب در اختیار نداشته باشید، خروجی شما نیز بی‌مصرف خواهد بود.

چند سال پیش، تیم تحت نظارت ایسرو در اپل، در رأس پشتیبانی از سیری قرار گرفت و در تجربه‌ی استفاده از این دستیار مجازی، یک اصلاح اساسی به وجود آورد. سیری اکنون بر اساس یادگیری عمیق و هوش مصنوعی توسعه می‌یابد. در نتیجه‌ی این اقدام، تغییرات و بهبود‌های گسترده‌ای به وجود آمده است. تشخیص خام صدای سیری اکنون با امکان تشخیص صحیح ۹۵ درصد از صحبت‌های کاربر، این دستیار مجازی را در کنار تمام رقبای خود قرار داده است. هوش مصنوعی اکنون در دو بخش مجزا و حیاتی از سیستم عمل می‌کند. اول، گفتار به متن؛ به معنی تلاش سیری برای درک صحبت‌های کاربر و دوم، متن به گفتار؛ به معنی تلاش سیری برای پاسخگویی به کاربر.

از آنجایی که شخصی‌سازی دستیار‌های مجازی به تدریج گسترده‌تر می‌شود، یکی از مهم‌ترین وظایف سیری، تشخیص صدای شما از بین دیگر صداها است. هرچه قدر سیری داده‌های بیشتری در اختیار داشته باشد و هر چه قدر الگوهای اپل تکامل بیشتری پیدا کنند، امکان تمایز بیشتر افراد از یکدیگر و حتی درک لهجه‌های غلیظ‌تر فراهم می‌شود. این موضوع همچنین یک مسئله‌ی امنیتی نیز محسوب می‌شود. محققان اخیرا دریافته‌اند که با استفاده از فرکانس‌های بسیار بالا و غیر قابل شنیدن برای انسان، می‌توانند با سیری ارتباط برقرار کنند و عملیات هک را به‌صورت نامحسوس انجام دهند. سیری باید یاد بگیرد بین صدای انسان و صدای ماشین و بین صدای شما و افراد دیگر تمایز قایل شود.

کپی لینک

آموختن صحبت کردن

یکی از راه‌های کاربردی برای درک نحوه‌ی فعالیت سیستم‌های دستیارهای صوتی، نگاه به فرآیند آموختن یک زبان جدید به سیری توسط اپل است. زمانی که اپل، سیری را برای یک بازار جدید – برای مثال زبان شانگهایی - عرضه می‌کند، تیم پشتیبانی در ابتدا پایگاه داده‌های موجود مربوط به آن زبان محلی را پیدا می‌کند. در ادامه آن‌ها افراد متخصصی را با زبان محلی استخدام می‌کنند و از آن‌ها می‌خواهند تا کتاب، روزنامه، مقاله‌های اینترنتی و ... بخوانند.

تیم اپل از صداهای ضبط‌شده رونوشت تهیه می‌کند و واژه‌ها را با صداها تطبیق می‌دهد و مهم‌تر از همه واج‌ها، یعنی کوچک‌ترین واحد آوایی مستقل که تمام گفتار را شامل می‌شوند مشخص می‌کند. در زبان انگلیسی، fourteen (عدد چهارده) یک واژه است و حرف صدادار e یک واج به حساب می‌آید. آن‌ها تلاش می‌کنند این واج‌های اداشده را به هر صورت ممکن ثبت کنند؛ زیرا محو شدن واج در انتهای واژه، از ابتدای آن شدیدتر و پیش از هر مکث بلندتر است و در یک جمله‌ی سؤالی نیز اوج می‌گیرد. هر گفتار، یک موج صوتی تقریبا متفاوت دارد و الگوریتم‌های اپل با تحلیل‌های مختلف، مناسب‌ترین موج صوتی را برای هر جمله‌ی مورد نظر پیدا می‌کنند. هر جمله‌ای که سیری ادا می‌کند شامل ده‌ها یا صدها واج مختلف است که همانند برش‌های یک مجله و با شکل‌های مختلف با یکدیگر ترکیب شده‌اند. احتمالا هیچ کدام از این واژه‌هایی که از زبان سیری می‌شنوید، دقیقا به همان شکلی که در ابتدا ضبط‌ شده‌اند نیستند.

Siri

ایسرو در این باره یک مثال مطرح می‌کند. بیاید جمله‌ی «آیا می‌خواهی این را تماشا (Watch) کنی؟» با جمله‌ی «من ساعت (Watch) تو را دوست دارم.» مقایسه کنیم. در حالت اول، زمانی که ایسرو واژه‌ی واچ را تلفظ می‌کند، صدای او رو به بالا، اما در حالت دوم رو به پایین می‌رود. ایسرو می‌گوید: «در هر دو جمله یک واژه‌ی یکسان به کار می‌رود؛ اما تلفظ آن‌ها کاملا با یکدیگر متفاوت است.» او نمی‌توانست از همان صدای ضبط‌شده‌ی واژه‌ی واچ یا حتی همان واج‌های اختصاصی در دو جمله استفاده کند؛ زیرا گوش دادن بی‌وقفه به سیستم‌هایی همانند مسیریاب‌های قدیمی جی‌پی‌اس که واژه‌ها را به‌صورت کشیده و با فشار بالا تلفظ می‌کنند، دشوار و ناخوشایند است.

حتی تا همین چند سال گذشته، قدرت پردازش کامپیوترها و سرورها به اندازه‌ای نبود که یک پایگاه داده‌ی بزرگ را بررسی و بهترین ترکیب صداها را برای هر تماس و پاسخ پیدا کنند. اما اکنون آن‌ها قادر به انجام این کار هستند و ایسرو و تیم او نیز خواهان بیشترین مقدار داده‌ی ممکن هستند. در نتیجه، هنگامی که آن‌ها یک الگوی ابتدایی بسازند، سیری را در حالتی به نام «دیکته‌ی صرف» منتشر می‌کنند. شما نمی‌توانید با سیری صحبت کنید؛ اما می‌توانید با فشردن دکمه‌ی میکروفون یک پیام متنی یا جستجوی اینترنتی به او دیکته کنید. این امکان، ورودی‌هایی از لهجه‌های مختلف با کیفیت متفاوت از میکروفون و موقعیت‌های متنوع برای ماشین‌های اپل فراهم می‌کند و منجر به این می‌شود تا عملکرد سیری برای افراد بیشتری بهبود یابد. اپل بنا به ادعای خود، به‌صورت ناشناس این داده‌ها را جمع‌آوری و رونویسی می‌کند و با این کار الگوریتم‌ها را بهبود می‌بخشد و شبکه‌ها را آموزش می‌دهد. آن‌ها در ادامه، داده‌های مکانی و تفاوت‌های گفتاری را اضافه می‌کنند. برای مثال برتری سه بر صفر یک تیم در مسابقه‌ی فوتبال در آمریکا به‌صورت three-zero و در بریتانیا به‌صورت three-nil بیان می‌شود. آن‌ها سپس به پالایش سیستم ادامه می‌دهند تا سرانجام سیری به درک تقریبا بی‌نقصی از واژه‌های زبان شانگهایی و نحوه‌ی تلفظ آن‌ها توسط مردم دست پیدا کند.

در همین زمان، اپل برای یافتن بهترین صدای موجود، شروع به راه‌اندازی یک جستجوی تمام‌عیار می‌کند. بدین منظور، آن‌ها کار خود را با صدها نفر آغاز و اقدام به ضبط نمونه‌های مختلف از جمله‌های احتمالی برای سیری می‌کنند. ایسرو سپس با همکاری با طراحان اپل و تیم رابط کاربری، بهترین صداها را انتخاب می‌کند. این قسمت کار بیش از آنکه علمی باشد، ماهیتی هنرمندانه دارد. در اینجا، آن‌ها شروع به گوش دادن به برخی از احساسات غیر قابل وصف، خالصانه و غیر مصنوعی انسانی می‌کنند.

اما قسمت بعدی، یک کار کاملا علمی است. ایسرو می‌گوید: «صداهای مناسب بسیار زیادی وجود دارد؛ اما این بدین مفهوم نیست که همه‌ی آن‌ها یک صدای متن به گفتار مناسب خواهند بود.» آن‌ها شروع به اجرای گفتارها از طریق الگوهایی که ساخته‌اند و یافتن تغییر پذیری واج‌ها، به‌خصوص تفاوت موج صوتی بین سمت چپ و راست هر عبارت کوچک می‌کنند. تغییرپذیری بیشتر بین یک واج، ترکیب تعداد زیاد آن‌ها را در یکدیگر و در حالت صوت طبیعی دشوار می‌کند. اما شما هرگز هیچ مشکلی در شنیدن آن صحبت‌ها نخواهید داشت و تنها کامپیوتر قادر به درک این تفاوت خواهد بود. ایسرو می‌گوید: «این کار تقریبا مثل زمانی است که شما مشغول چسباندن کاغذدیواری هستید و در این حین، باید حواستان به درز‌ها باشد تا مطمئن شوید همه‌ی آن‌ها با یکدیگر هم‌تراز هستند.»

هنگامی که آن‌ها از بین صداهای مختلف، صدای مناسب انسان و کامپیوتر را یافتند، در هر بار، آن‌ را برای هفته‌ها ضبط می‌کنند. آن صدا سرانجام به صدای سیری تبدیل خواهد شد. این مراحل، فرآیند یافتن صدای مناسب را برای ۲۱ زبان تحت پشتیبانی سیری و بومی‌سازی آن‌ها برای ۳۶ کشور، یعنی بیش از مجموع تمام رقبای اصلی‌اش شامل می‌شود. در مجموع، ماهیانه ۳۷۵ میلیون نفر از سیری استفاده می‌کنند. این عدد، به‌خصوص برای یک دستیار صوتی با فهرستی بلندبالا از کمبودهای قابل توجه، رقم بسیار بالایی محسوب می‌شود.

با این حال، ۳۷۵ میلیون نفر در سرتاسر جهان از محصولات متنوع اپل استفاده می‌کنند. سیری تقریبا از طریق تمام محصولات اپل، از آیفون تا اپل واچ، تا مک‌بوک و اپل تی‌وی، قابل دسترس است. تحلیلگران پیش‌بینی می‌کنند که به‌زودی بیش از یک میلیارد دستگاه آیفون، در یک زمان با هم فعال خواهند شد. سیری یک قابلیت محبوب و مهم است؛ اما تقریبا در همه جا قابل دسترسی نیست و قطعا برای اغلب افراد نیز ضروری محسوب نمی‌شود. شما برای استفاده از گوشی خود به شیوه‌ی مورد نیازتان، احتیاجی به سیری ندارید. در نتیجه اکنون که اپل یک دستیار قابل اطمینان دارد، باید به مردم نحوه‌ی استفاده از آن را آموزش دهد.

کپی لینک

همه چیز را از من بپرس

تمام آنچه که لازم است درباره‌ی برنامه‌های اپل برای سیری بدانید، از طریق ویدئوی تبلیغاتی زیر قابل مشاهده است. این آگهی تبلیغاتی، یک روز معمولی از زندگی دواین جانسون، بازیگر هالیوودی را به همراه دستیار و دوست نزدیکش نشان می‌دهد. جانسون درحالی‌که مشغول ورزش و هرس کردن گلدانش است، با استفاده از سیری تقویم گوشی را اجرا و یادآوری‌هایش را بررسی می‌کند. سپس با استفاده از اپلیکیشن لیفت، یک تاکسی سفارش می‌دهد و خودش مشغول رانندگی می‌شود و درحالی‌که با بی‌ملاحظگی سرعت می‌گیرد، وضعیت آب و هوا را بررسی می‌کند. جانسون در صحنه‌‌ی بعدی درحالی‌که مشغول نقاشی دیوار کلیسای سیستین در رم است، ایمیل خود را چک می‌کند و درحالی‌که مشغول انجام کارش است، مکالمات کوتاهی برقرار می‌کند. وی در نهایت با استفاده از اپلیکیشن فیس‌تایمز در فضا از خود سلفی می‌گیرد و بابت تمام خدمات سیری از او تشکر می‌کند؛ سیری نیز در پاسخ، با لحنی ناخوشایند او را آقای بزرگ، کچل و زیبا خطاب می‌کند. در صورتی که سیری در آی‌اواس ۱۱ به این شیوه صحبت کند، قطعا احساس بدی به ما دست خواهد داد.

از همان ابتدای مصاحبه، جوزویاک اعلام می‌کند که اپل قصد دارد سیری را به یک دستگاه همه‌کاره و کاربردی تبدیل کند. اینکه کاربران، اغلب دستیارهای را صوتی بر اساس پرسیدن سؤال‌های بی‌اهمیت با یکدیگر مقایسه می‌کنند، جوزویاک را عصبانی می‌کند. سیری همیشه در این رقابت‌ها به نسبت ضعیف ظاهر می‌شود. جوزویاک می‌گوید» «ما این چیز (سیری) را با این هدف طراحی نکردیم که پاسخگوی سؤالات بی‌معنی باشد!»

در عوض، جوزویاک همچنان توجه خود را به آگاهی‌رسانی به مردم و تشویق آن‌ها به استفاده‌ی بیشتر از دوست ماشینی‌شان معطوف کرده است. وی به قابلیت سیری در انجام جستجوی پیچیده‌ی فایلی در مک یا آگاهی عمیق محصول پیش‌روی هوم‌پاد از موسیقی‌ها اشاره می‌کند. چند روز پس از ملاقات ما، زمانی که سیری یک جایزه‌ی فنی امی برای کنترل و جستجوی صوتی برنده شد، مثال دیگری نیز مطرح شد. در حال حاضر سیری می‌تواند آهنگ‌های شما را به عقب یا جلو ببرد. کافی است عبارت «هی سیری، دو دقیقه به عقب بازگرد» را بیان کنید و از نتیجه‌ی شگفت‌انگیز آن لذت ببرید.

با وجود تمام این مثال‌‌ها، سیری قادر به انجام تمام کارها یا حتی اغلب کارها نیست. بیشترین کاربرد این دستیار صوتی، صرفه‌جویی در وقت با کاهش تعداد تپ‌ها و میزان تایپ کردن‌ است و نه پاسخ دادن به سؤالات پیچیده‌ی بی‌اهمیت یا بحث کردن با کاربر. با این حال، از آنجایی که سیری ظاهرا هیچ محدودیتی ندارد، می‌توانید هر سؤالی از او بپرسید. ایسرو می‌گوید: «اینکه کاربران بدانند قادر به گفتن چه چیزهایی هستند، برای آن‌ها اهمیت دارد.» بخشی از وظیفه‌ی ایسرو، یاری رساندن به سیری در به کار بردن مناسب‌تر مهارت‌هایش و شکست بدون ترس در زمان لازم است. ایسرو می‌گوید: «ما تلاش می‌کنیم چنین قابلیت‌هایی را به سیری اعطا کنیم تا بداند آنچه را که نمی‌داند. اما این مسئله، موضوع دشواری است.» وب‌سایت اپل و حتی ‌آگهی‌های تبلیغاتی این شرکت به شیوه‌ای طراحی شده‌اند تا درک مردم را دربا‌ره‌ی توانایی‌ها و ضعف‌های سیری به‌طور همزمان افزایش دهند.

چالش بعدی، یاد‌آوری به مردم درباره‌ی وجود سیری است. ایسرو می‌گوید مردم در انجام امور، عادت‌های خود را دارند. اگر آن‌ها به تایپ کردن عادت کرده‌اند، تغییر این عادت نیازمند زمان است. در نتیجه اپل تلاش می‌کند به تدریج مردم را به مسیر درست هدایت کند. در آی‌اواس ۱۱، سیری حضور بسیار بیشتری دارد و بیش از پیش فعال است. او بر وب‌گردی شما نظارت می‌کند، سپس اخبار اپل نیوز را به شما پیشنهاد می‌دهد یا به شما کمک می‌کند در مواقع لازم یک رویداد را به تقویم اضافه کنید. سیری جدید یک دستیار صوتی انعطاف‌پذیر است. اهمیتی ندارد که از چه گجتی استفاده می‌کنید؛ سیری تنظیمات شما را بین دستگاه‌های مختلف همگام‌سازی می‌کند. سیری مثل همیشه به‌خوبی شما را می‌شناسد.

در طول سال‌ها، اپل در فراهم کردن امکان سازگاری توسعه‌دهندگان با سیری، سرعت عمل مناسبی نداشته است. درحالی‌که آمازون و گوگل، توسعه‌دهندگان را به طراحی اپلیکیشن برای دستیارهای مجازی‌شان، الکسا و گوگل اسیستنت تشویق کرده‌اند، درهای اپل تاکنون به روی سازندگان اپلیکیشن بسته بوده است. سیری، تمام آن کارهایی را که رقبا قادر به انجامشان هستند، تنها می‌تواند در اپلیکیشن‌های اختصاصی اپل انجام دهد. سیری وجود اپلیکیشن‌هایی نظیر نقشه‌های گوگل یا اوت‌لوک را روی گوشی شما انکار می‌کند. سیری همچنین بدون هوم کیت (پلتفرم اینترنت اشیاء اپل) قادر به روشن کردن هیچ لامپی نخواهد بود. سال گذشته، اپل به‌صورت محتاطانه، دسترسی لازم را برای توسعه‌دهندگان بیشتری فراهم کرد و به کاربران اجازه داد با استفاده از سیری تماس صوتی واتساپ برقرار کنند، با اوبر تاکسی سفارش دهند و با کیف پول مجازی Venmo پول ارسال کنند. در حال حاضر در آی‌اواس ۱۱، این دسترسی تاحدودی بیشتر شده است.

Siri

از آنجایی که آمازون و گوگل پشتیبانی از توسعه‌دهندگان را به سرعت گسترش می‌دهند و قابلیت‌های بیشتری به دستیارهای صوتی‌شان اضافه می‌کنند، چنین حرکت‌های آهسته‌ای از سوی اپل منجر به تغییر نگاه عموم به این شرکت می‌شود. با این وجود، جوزویاک به سیاست‌های اپل اطمینان دارد. به باور او، پرسش اصلی این نیست که تعداد کارهای قابل انجام با سیری چقدر است؛ بلکه مسئله‌ی اصلی این است که سیری چگونه آن کارها را به نحو مناسب انجام می‌دهد. زیرا آنچه ما تمایل به انجام آن نداریم دست و پاگیر می‌شود. جوزویاک، جمله‌‌شناسی درخواست‌های مطرح‌شده با الکسا و گوگل اسیستنت را مناسب نمی‌داند؛ درخواست‌هایی نظیر «الکسا، از طالع‌بینی دیلی هوروسکوپس در مورد برج گاو سؤال کن» یا «اوکی گوگل، اجازه بده با اپلیکیشن Todoist صحبت کنم،» از نظر جوزویاک نامناسب هستند. او ترجیح می‌دهد دستیار صوتی آن‌ها تا زمانی که شما خواسته‌ی خود و چگونگی و نحوه‌ی انجام آن را درخواست می‌کنید صبر کند. اپل مثل همیشه ترجیح می‌ده به جای انجام نصف و نیمه‌ی کاری، آن را اصلا انجام ندهد.

مشکل جمله‌شناسی در نهایت به همان نحوه‌ی صحبت کردن سامانتا که منجر به بروز احساسات عمیق بین او و تئودور شده بود بازمی‌گردد. ایسرو می‌گوید صدای بهترین کامپیوترها، حتی نمونه‌های موجود در فیلم‌های علمی تخیلی، شبیه انسان است؛ یعنی مکث‌های مناسب، تلفظ مناسب و صدای روانی دارند و در صحبت کردن آن‌ها، تنها کمی ته‌صدای رباتیک به گوش می‌رسد. او می‌خواهد چیزی بسازد که مناسب باشد و آن را در اختیار همه قرار دهد تا هر زمان که قصد انجام کاری داشتند، تنها به سیری مراجعه کنند.

مقاله رو دوست داشتی؟
نظرت چیه؟
داغ‌ترین مطالب روز
تبلیغات

نظرات