فناوری جدید گوگل؛ تشخیص زبان بدن افراد بدون نیاز به دوربین

دوشنبه ۸ فروردین ۱۴۰۱ - ۲۱:۰۰
مطالعه 9 دقیقه
نوآوری جدید بخش محصولات و فناوری‌های گوگل یا ATAP، می‌تواند حرکات بدن افراد و زبان بدن آن‌ها را بدون استفاده از دوربین و با تکیه بر امواج راداری تشخیص دهد.
تبلیغات

تیم تحقیقاتی شرکت گوگل در حال کار روی فناوری‌ای است که به کامپیوترها اجازه می‌دهد تا با کمک رادار به اطراف و حرکات اشخاص پاسخ دهند. تصور کنید کامپیوتر شما تصمیم بگیرد دریافت یک پیام را با صدا اعلام نکند؛ چون می‌داند که در آن لحظه پشت میزتان ننشسته‌اید یا فرض کنید وقتی برای جواب‌دادن به صدای در از جای خود بلند شدید و در همین حین تلویزیونتان به‌طور خودکار نمایش فیلم از نتفلیکس یا شبکه‌ای دیگر را متوقف کند و وقتی به کاناپه‌ی خود برگشتید، فیلم دوباره شروع به پخش شود. آینده‌ای را تصور کنید که در آن کامپیوترها رفتارهای اجتماعی انسان را درک می‌کنند و به همراهان باملاحظه‌تری برای ما تبدیل می‌شوند.

تصور کامپیوتری که تک‌تک حرکات فرد را زیرنظر دارد، شاید کمی ناخوشایند و شبیه سناریو فیلم‌های علمی‌تخیلی به‌‌نظر برسد؛ اما وقتی بدانید که کامپیوترها برای تشخیص مکان و حرکت‌های افراد از هیچ دوربینی استفاده نمی‌کنند، شاید کمی از نگرانی‌هایتان کاسته شود و این حس ناخوشایند یا گارد اولیه اندکی تعدیل شود.

در‌واقع، گوگل تصمیم دارد به‌جای دوربین از رادار برای دنبال‌کردن حرکت کاربران استفاده کند. بخش محصولات و فناوری‌های پیشرفته‌ی گوگل که به‌اختصار ایتپ (ATAP) هم نامیده می‌شود و پیش‌از‌این روی پروژه‌های عجیب‌وغریبی مانند کت جین حساس به لمس کار کرده است، در چند سال گذشته توجه خود را به موضوع دیگری معطوف کرده‌ است.

مهندسان ایتپ امیدوار‌ند با استفاده از رادارها سیستمی را توسعه دهند که در آن کامپیوترها با تشخیص رفتارها و گمانه‌زنی درباره‌ی نیازهای کاربران، به‌درستی به آن‌ها واکنش نشان دهند. البته این اولین‌بار نیست که گوگل به استفاده از رادار برای آگاهی‌بخشی به محصولات خود روی آورده است. در سال ۲۰۱۵، گوگل سولی را رونمایی کرد. سولی سنسوری است که از امواج الکترومغناطیس راداری برای تشخیص دقیق حالات و حرکات بدن انسان استفاده می‌کند. از این سیستم اولین‌بار در گوشی پیکسل ۴ گوگل برای تشخیص حرکات ساده دست استفاده شد.

کاربران پیکسل ۴ با حرکات دست خود و بدون لمس فیزیکی گوشی می‌توانستند از دستورها ساده‌ای مانند توقف پخش موسیقی یا به‌تعویق‌انداختن آلارم استفاده کنند. اخیراً نیز گوگل از حسگرهای راداری در نسل دوم نمایشگر هوشمند خود به نام نست‌هاب برای تشخیص حرکات و ریتم تنفس افراد خوابیده در‌کنار نمایشگر استفاده کرده است. این وسیله برعکس گجت‌هایی مانند ساعت‌های هوشمند بدون نیاز به تماس فیزیکی می‌تواند حرکات افراد در خواب را زیرنظر بگیرد.

این گیف نمایی از نزدیک‌شدن انسان به فضای پیرامون کامپیوتر و عملکرد رادار را نشان می‌دهد. با نزدیک‌‌شدن فرد به کامپیوتر، داده‌های مربوط به مسافت و سایر متغیرها روی نمایشگر دستخوش تغییر می‌شوند.

تیم ایتپ در پروژه‌ی جدید خود نیز از حسگرهای سولی بهره گرفته است؛ اما به‌جای استفاده از ورودی‌های سنسور برای کنترل مستقیم کامپیوتر، مهندسان ایتپ قصد دارند از داده‌های به‌دست‌آمده از سنسورها برای تشخیص حرکات روزمره‌ی افراد و در جهت کمک به تصمیم‌گیری کامپیوترها استفاده کنند.

لئوناردو جیوستی، مسئول ارشد بخش طراحی ایتپ می‌گوید:

معتقدیم هم‌زمان با حضور گسترده‌تر تکنولوژی در زندگی روزمره‌ی انسان‌ها، منصفانه است از خودِ تکنولوژی بخواهیم از برخی از حرکات ما به سرنخ‌هایی دست پیدا کند.

فرض کنید قصد دارید خانه را ترک کنید و مادرتان به شما یادآوری کند که با خود چتر بردارید؛ چون باتوجه‌‌به وضعیت هوا، ممکن است باران ببارد. به‌کمک این فناوری ممکن است ترموستات منزلتان هنگامی که از جلو آن رد می‌شوید، همین پیام را به‌نمایش بگذارد یا به‌عنوان مثالی دیگر، وقتی تلویزیون متوجه شود که روی کاناپه به‌خواب رفته‌اید، بلندی صدا را به‌طور خودکار کم کند.

کپی لینک

تحقیقات راداری

به‌گفته‌ی جیوستی، قسمت اعظم تحقیقات آن‌ها بر حیطه‌شناسی استوار شده است. حیطه‌شناسی علمی است که نحوه‌ی استفاده‌ی انسان‌ها از فضای اطراف آن‌ها را به‌عنوان بستری برای تعاملات اجتماعی بررسی می‌کند. وقتی به شخص دیگری نزدیک می‌شوید، انتظار دارید صمیمت و تعامل شما با آن شخص بیشتر شود. تیم تحقیقاتی ایتپ از این رفتار و دیگر اشاره‌ها و انتظارات اجتماعی برای پایه‌گذاری نحوه‌ی تعامل انسان‌ با دستگاه‌ها و تعریف فضای خصوصی بین آن‌ها استفاده کرده‌اند.

رادارها می‌توانند تشخیص دهند که یک شخص چه زمانی به آن‌ها نزدیک و وارد فضای خصوصی‌شان می‌شوند. داشتن قابلیتی این‌چنینی بدین‌معنا است که کامپیوتر در موقعیت‌های مناسب می‌تواند کارهای مشخصی را انجام دهد. برای نمونه، هنگام نزدیک‌شدن کاربر نمایشگر را از حالت خواب بیدار کند، بدون اینکه نیاز باشد کاربرد دکمه‌ای فیزیکی را فشار دهد.

در‌حال‌حاضر، گوگل از این فناوری تعاملی در نمایشگرهای هوشمند خود بهره می‌برد؛ اما گوگل‌نست برای تعامل با کاربران به‌جای رادار از امواج فراصوت یا اولتراسونیک برای محاسبه‌ی فاصله‌ی شخص از نمایشگر استفاده می‌کند. وقتی نست‌هاب متوجه نزدیک‌شدن کاربر می‌شود، روی نمایشگر خود اعلان‌های مهم مانند رویداد‌های تقویم و یادآوری‌ها و دیگر نوتیفیکیشن‌ها را به‌نمایش در‌می‌آورد.

بااین‌همه، تشخیص فاصله از دستگاه به‌تنهایی کافی نیست؛ زیرا ممکن است شخص در آن لحظه فقط در حال عبور از کنار دستگاه بوده باشد یا شاید او در حال نگاه‌کردن به‌سمت دیگری باشد و اصلاً در آن هنگام قصد نداشته باشد با کامپیوترش تعامل کند. برای حل این مسئله، سنسور سولی می‌تواند برخی ظرافت‌های پیچیده در حرکات و ژست‌ها مانند جهت‌گیری بدن و مسیر حرکت احتمالی افراد و جهت چهره‌ی شخص را ارزیابی کند.

همچنین، سنسور سولی به‌منظور ارزیابی و تشخیص این ظرافت‌ها می‌تواند از الگوریتم‌های یادگیری ماشین برای پالایش و غربالگری داده‌ها استفاده کند. اطلاعات باارزش به‌دست‌آمده از رادارها به سنسور سولی کمک می‌کند تا با دقت بیشتری منظور کاربران را پیش‌بینی کند: اینکه آیا واقعا کاربر قصد دارد تعامل با کامپیوتر را شروع کند یا نه و اگر جواب مثبت باشد، بهترین نحوه‌ی تعامل با آن احتمالاً چگونه خواهد بود.

اعضای تیم ایتپ برای بهبود عملکرد سنسورها شماری از حرکات و ژست‌ها و ضبط این حرکات را با دوربین‌ در اتاق نشیمن منزل خود انجام دادند (در طول دوران همه‌گیری همه‌ی آن‌ها مجبور بودند در منزل بمانند). این در حالی‌ بود که حسگرهای راداری هم‌زمان به تحلیل حرکت آن‌ها مشغول بودند. لورن بدال، طراح ارشد بخش تعاملی ایتپ، در‌این‌باره توضیح می‌دهد:

ما در جهت‌های مختلف حرکت می‌کردیم و مجموعه‌ای از حرکات را انجام می دادیم و با‌‌‌توجه‌‌‌به اینکه سیستم‌ها به‌طور لحظه‌ای حرکت‌ها را ثبت و ارزیابی می‌کردند، می‌توانستیم داده‌های به‌دست‌آمده از دوربین‌ و سنسورها را با‌هم مقایسه و قدم‌های بعدی برای افزایش دقت حسگرهای راداری را طراحی کنیم.

لورن بدال سابقه‌ی فعالیت در عرصه‌ی حرکات رقص حرفه‌ای را هم دارد. وی می‌گوید این فرایند بسیار شبیه به کار طراحان رقص در توسعه‌ی ایده‌ی یک حرکت ساده و تبدیل آن به مجموعه‌ای از حرکات مختلف ازطریق تغییر وضعیت و جهت‌گیری بدن است. برپایه‌ی این مطالعات، تیم تحقیقاتی ایتپ شماری از حرکات مشخص را تعریف کردند؛ حرکاتی که از تعاملات غیرکلامی انسان‌ها با تجهیزات فیزیکی الهام گرفته‌اند؛ مانند نزدیک‌شدن به یک وسیله یا دورشدن از آن، گذشتن از کنار آن، چرخاندن سر به‌سمت وسیله یا به‌سمت دیگر و نگاه‌انداختن به آن وسیله.

بدال برخی از نمونه‌های تعامل کامپیوتر با انسان ازطریق تشخیص حرکات را توضیح می‌دهد. اگر یک دستگاه احساس کند که کاربر در حال نزدیک‌شدن به آن است، می‌تواند ابزار کنترل لمسی را فعال کند یا اگر شخص به‌سمت وسیله حرکت کند، نمایشگر آن روشن می‌شود و اعلان‌های مهم را به‌نمایش می‌گذارد یا درصورتی‌که کاربر اتاق را ترک کند‌‌، تلویزیون می‌تواند برنامه را در همان لحظه متوقف کند و بعد از برگشتن شخص به اتاق، برنامه را از همان لحظه‌ی توقف شروع به پخش کند.

اگر وسیله‌ای تشخیص دهد که شخص در حال عبور از کنار آن است، با نمایش نوتیفیکیشن‌های غیرمهم مزاحمتی برای او ایجاد نخواهد کرد. اگر کاربر در آشپزخانه مشغول تماشای ویدئو‌ دستورپخت غذا است و وقتی به‌سراغ کابینت می‌رود تا ادویه بردارد، پخش ویدئو به‌صورت خودکار قطع می‌شود تا وقتی که او به مکان خود برگردد و قصد خود برای ادامه‌ی تماشای ویدئو را نشان دهد.

زمانی که کاربر مشغول مکالمه با تلفن‌همراه خود است و یک لحظه‌ به نمایشگر هوشمند نگاه می‌اندازد، نمایشگر می‌تواند گزینه‌ی انتقال تماس تصویری را نمایش دهد تا کاربر بتواند مکالمه را به‌صورت تصویری با نمایشگر ادامه دهد. بدال در‌این‌باره توضیح می‌دهد:

تمام این حرکات انگشت‌ها را به‌سمت آینده‌ای نشان گرفته‌اند که در آن کامپیوترها به‌طرز نامرئی حرکت‌های طبیعی ما را ارزیابی می‌کند. ایده‌ی اصلی ما این است که کامپیوترها به‌نوعی فقط در پس‌زمینه کار کنند و فقط در موقعیت‌های مناسب به کمک ما بیایند. ما در حال جابه‌جایی مرزها و کشف تمام روش‌های ممکن برای تعامل انسان با کامپیوتر هستیم.
کپی لینک

نزدیکی بیشتر کامپیوتر به انسان

استفاده از رادار برای تأثیرگذاری بر نحوه‌ی عکس‌العمل کامپیوترها به حرکات انسانی مشکلات خاص خود را به‌همراه دارد. برای مثال، رادارها می‌توانند اشخاص متعددی را در یک محیط تشخیص دهند. اگر این افراد خیلی به یکدیگر نزدیک باشند، رادار آن‌ها را به‌شکل توده‌ای بی‌شکل می‌بیند؛ مشکلی که می‌تواند در توانایی تصمیم‌گیری دستگاه‌ها اختلال ایجاد کند.

با‌‌توجه‌‌به مشکلات فراروی نسل جدید حسگرهای راداری، بدال چندین مرتبه به این موضوع تأکید می‌کند که فناوری اخیر هنوز در فاز مطالعاتی قرار دارد و قرار نیست در نسل بعدی نمایشگرهای هوشمند گوگل از این فناوری استفاده شود.

ایتپ گوگل و تشخیص حرکات انسان با رادار

یکی از مزایای استفاده از حسگرهای راداری این است که دستگاه‌های مجهز به رادار در طول زمان می‌توانند الگوی حرکتی رفتار افراد را یاد بگیرند. طبق گفته‌ی لئوناردو جیوستی، این توانایی یکی از اهداف مهم نقشه‌ی راه ایتپ است که می‌تواند به در‌پیش‌گرفتن عادت‌های رفتاری جدید و سالم کاربران کمک کند. فرض کنید که در نیمه‌ی شب به‌سراغ کابینت میان‌وعده‌های آشپزخانه خانه‌تان بروید؛ اما به‌یک‌باره نمایشگر هوشمند شما در آشپزخانه روشن شود و علامت بزرگ توقف را نشان دهد.

وقتی از پیش‌بینی رفتار کاربران و انجام عملیات‌های پیش‌دستانه صحبت می‌شود، وسیله‌های هوشمند و کامپیوترها باید حد تعادل نسبی را رعایت کنند. برای مثال، شاید شخصی دوست داشته باشد هنگام آشپزی تلویزیون را روشن کند، بدون اینکه قصد تماشای آن را داشته باشد. این مثال احتمالاً برای بیشتر ما پیش آمده است. در این وضعیت و مثال‌های مشابه دیگر، رادارها نمی‌توانند حضور شخص را در اتاق نشیمن تشخیص دهند و تلویزیون به‌جای ادامه‌ی پخش برنامه، آن را متوقف خواهد کرد.

بدال درباره‌ی چنین وضعیت‌هایی این‌گونه توضیح می‌دهد:

وقتی درباره‌ی الگوهای رفتاری مطالعه می‌کنیم، رفتارهایی که بسیار نامرئی و تفکیک‌نشدنی و سیال هستند، باید تعادل مناسبی را بین اتوماسیون و دخالت کاربر در کنترل دستگاه ایجاد کنیم. وقتی از تعامل انسان با دستگاه در چنین وضعیت‌هایی سخن به‌میان می‌آید، این تعامل باید بدون‌دردسر و به همان روانی و سیالی الگوهای رفتاری باشد تا کاربر از دخالت بیجای دستگاه احساس رنجش و خستگی نکند. بنابراین، برای مواقعی که کاربر انتظار دارد اختیار بیشتری در کنترل دستگاه داشته باشد، باید از دسترسی او به تعدادی از سطوح کنترلی و تنظیمات دستی مطمئن شویم.

یکی از دلایل تیم ایتپ برای انتخاب فناوری رادار به ماهیت آن در حمایت از حفظ حریم‌خصوصی برمی‌گردد. رادارها با اینکه داده‌های باارزشی از موقعیت و حرکات افراد را جمع‌آوری می‌کنند، در بحث حریم‌‌ خصوصی یکی از فناوری‌های مطمئن هستند. همچنین، رادارها دوره‌ی تأخیر کمی‌ دارند و در تاریکی کار می‌کنند و عوامل خارجی مانند صدا و دما روی عملکرد آن‌ها تأثیر نمی‌گذارد.

برخلاف دوربین، رادارها نمی‌توانند تصاویر واضحی از بدن و صورت و هرچیز شناسایی‌شدنی دیگری را جمع‌آوری یا ذخیره کنند. جیوستی در‌این‌باره توضیح می‌دهد: «رادار بیشتر شبیه به سنسور حرکتی پیشرفته است.»

محدوده‌ی شناسایی سنسور سولی در حدود ۳ متر است؛ بنابراین، درمقایسه‌با اکثر دوربین‌ها محدوده‌ی فعالیت کمی دارد. بااین‌حال، استفاده از چندین وسیله‌ی مجهز به سنسور سولی می‌تواند مانند یک شبکه‌ی هماهنگ و مؤثر تمام فضای خانه‌ی را به‌منظور شناسایی حرکات و موقعیت افراد پوشش دهد.

اشاره به این‌ نکته نیز ضروری به‌نظر می‌رسد که سنسور سولی که از آن در نمایشگر هوشمند نست‌هاب گوگل استفاده شده است، از قابلیت پردازش محلی بهره می‌برد و داده‌های خام هیچ‌گاه به فضای ابری فرستاده نمی‌شوند.

کریس هریسون، محقق حوزه‌ی تعامل انسان با کامپیوتر در دانشگاه کارنگی ملون در ایالت پیتسبورگ و مدیر گروه تحقیقاتی فیوچر اینترفیس، معتقد است کاربران دیر یا زود باید انتخاب کنند که آیا خرید محصولات گوگل به ریسک افشای اطلاعات خصوصی آن‌ها می‌ارزد یا نه؛ چون هرچه باشد، طبق گفته‌ی هریسون، هیچ‌کس در جهان درزمینه‌ی کسب درآمد از راه اطلاعات مشتریانش به پای شرکت گوگل نمی‌رسد.

بااین‌حال هریسون معتقد است استفاده‌نکردن از دوربین در محصولات گوگل نشانگر رویکرد حمایت از حریم‌ خصوصی و اولویت‌دهی به ارزش‌های کاربران است. او اضافه می‌کند:

چیزی به‌عنوان ناقض حریم‌ خصوصی یا مدافع حریم‌ خصوصی وجود ندارد. همه‌‌چیز را باید به‌صورت یک طیف در نظر گرفت که نقض یا حمایت از حریم‌ خصوصی دو در سر آن قرار گرفته‌اند و هر محصول دیجیتالی در جایی بین این‌ دو قرار می‌گیرد.

همچنان که وسایل زندگی روزمره به‌شکل اجتناب‌ناپذیری به حسگرهای بیشتری مجهز می‌شوند، توانایی این تجهیزات در درک رفتار انسان‌ها بیشتر می‌شود. هریسون معتقد است در آینده تعامل انسان با کامپیوترها در تمام جنبه‌های تکنولوژی به‌همان شکلی خواهد بود که محققان تیم ایتپ به‌دنبال آن هستند. هریسون می‌افزاید:

اساساً انسان‌ها برای درک رفتارهای انسانی برنامه‌ریزی شده‌اند و اگر زمانی کامپیوترها موفق شوند این تعامل غیرکلامی را به‌طور کامل رمز‌گشایی کنند، موقعیت‌های کاملاً آزاردهنده‌ای برای انسان‌ها پیش آید. دخالت‌دادن دانشمندان علوم اجتماعی و رفتاری در تحقیقات کامپیوتری می‌تواند چنین تجربیاتی را خوشایند‌تر کند و وجهه انسانی به آن‌ها ببخشد.
مقاله رو دوست داشتی؟
نظرت چیه؟
داغ‌ترین مطالب روز
تبلیغات

نظرات