آیا فناوری تشخیص چهره نگران کننده است؟
استارتاپ Cainthus، شرکتی نوپا در حوزهی فناوری تشخیص چهره محسوب میشود که بهطور اختصاصی روی شناسایی گاوها در دامداریها کار میکند. مدیر این استارتاپ یعنی دیوید هانت جلسهای با نویسندهی مقالهی اصلی یعنی دیوید اون و یک دامدار ایرلندی به نام استفان لالر داشته است. لالر در دامداری خود در نزدیکی شهر دوبلین، روزانه شیر حدود ۳۰۰ گاو را میدوشد. کنترل رفتار گاوها و نحوه و مقدار غذا خوردن آنها، چالشی بود که لابر را به هانت رساند.
کاینتوس از دوربینهای نظارتی درکنار بینایی ماشین و تصویربرداری پیشگویانه برای ردگیری حیوانات و رفتار آنها استفاده میکند. لالر مانند بسیاری از دامداران بزرگ دیگر جهان، برای پیشرفت کسبوکار و افزایش تولید خود، انواع فناوری را بهکار میگیرد. فرزندان این دامداران امروز در فکر شرکتهای بزرگ همچون گوگل هستند اما خودشان، از فناوریها در همان کسبوکارهای قدیمی استفاده میکنند. لالر تصمیم دارد برای خرید بعدی دامداری خود، یک روبات تهیه کند.
تشخیص چهرهی دامها
برادر دیوید هانت یعنی راس، مدیر امور مالی استارتاپ است. آنها ۳۶ سال سن دارند و در یک منطقهی کوچک کشاورزی و دامداری در کانمارا در ساخل غربی ایرلند بزرگ شدهاند. آنها برای مدتها تنها خانوادهی منطقه محسوب میشدند که کامپیوتر شخصی داشتند. این دو برادر پس از فارغالتحصیلی از دانشگاه شغلهایی را در حوزههای کسبوکار و مالی پیدا کردند.
برادران هانت ابتدا در کارخانهی غلات پدر خود استخدام شدند و پس از مدتی مدیریت آن را بهطور کامل بر عهده گرفتند. آنها ابتدا نرمافزارهای شرکت را بهروزرسانی کرده و به فضای ابری منتقل کردند. سپس برنامهی معاملات آتی روی غلات را لغو کردند. درآمد شرکت در ۲.۵ سال پس از شروع فعالیت برادران هانت، تقریبا دوبرابر شد.
دیوید و راس هانت پس از کسب موفقیتهای اولیه در شرکت غلات، از کار در آنجا خسته شده و هر دو به انکوباتوری در سیلیکونولی پیوستند. پیتر دیاماندیس و ری کورزویل، مدیران این انکوباتور بودند. درنهایت آنها استارتاپ Cainthus را در سال ۲۰۱۶ تأسیس کردند. شریک دیگر آنها رابین جانستون نام داشت که در نزدیکی مزارع تولید لبنیات در کانادا بزرگ شده بود و سابقهای هم در حوزهی بینایی کامپیوتری داشت.
نام شرکت Cainthus ترکیبی از کلمهی Canthus به معنای نقطهای در گوشهی چشم و حرف i بهعنوان نماد هوش مصنوعی (intelligence) است. راس اعتقاد دارد برای پیدا شدن بهتر در گوگل، باید اسم شرکت را اختراع کرد.
استارتاپ کاینثوس فناوری تشخیص چهرهی دامها را توسعه داده است
دیوید و راس هانت اعتقاد دارند کشاورزی صنعتی است که کمترین تأثیر را از تحولات دیجیتالی گرفته است. آنها میگوید هوش مصنوعی میتواند تأثیرات محیطی کشاورزی روی طبیعت را نیز کاهش دهد. تأثیرات مذکور با افزایش بهرهوری و کاهش خطرات کشاورزی و دامداری ایجاد میشود.
آیدان کانولی یکی از سرمایهگذاران اولیهی استارتاپ کاینثوس بود. او مدیر نوآوری در شرکت فناوری کشاوری Alltech است و اعتفاد دارد این استارتاپ، دنیا را تغییر خواهد داد. بهعنوان مثال دامداران با گلههای بزرگ، با استفاده از فناوریهای استارتاپ کاینثوس، مانند دامداران با گلههای کوچکتر، رفتار تکتک گاوها را شناسایی و تحلیل میکنند.
شرکت عظیم بینالمللی Cargill فعال در صنعت جهانی غذا، از ابتدای سال جاری به جمع سرمایهگذاران و شرکای توسعهای Cainthus پیوست. این شرکت در مدت یک هفتهی منتهی به نگارش مقاله، ۵ مزرعهی دامداری دیگر را فناوری خود مجهز کرد. ۳ مزرعهی جدید در کانادا و ۲ مزرعه در ایتالیا، مشتریهای جدید آنها بودند.
برادران هانت، چشمانداز خود را فراتر از کشاورزی و دامداری ترسیم کردهاند. حوزهی تشخیص چهره و رفتار دامها، به استارتاپ کاینثوس نسبت به رقبا برتری حدودی داده است. آنها در مقابل شرکتهای فعال در زمینهی تشخیص چهرهی انسانها، پیشرفتهای آسانتری داشتهاند؛ چرا که دامها برخلاف انسانها پوشش متفاوت روی صورت ندارند، در صورت کنترل تصویری شکایت نمیکنند و درنهایت، میتوان رفتارهای آنها را تغییر داد.
نکتهی مهم برای آیندهی استارتاپ کاینثوس، پیادهسازی آن برای تحلیل رفتارهای انسانی و کاربردهای جامعتر خواهد بود. بهعنوان مثال میتوان از نسخههای بعدی این فناوری برای کنترل ورزشکاران و اعلام خطر در مواقع گوناگون بیماری یا مصدومیت اشاره کرد. البته، قطعا ظرفیت بهکارگیری فناوری برای کاربردهای نامناسب هم وجود دارد و باید مراقب آن بود. دیوید دربارهی این کاربردهای خطرناک میگوید: «اگر در ابتدا بهاندازهی کافی از این فناوری نترسید، یعنی مفهوم آن را بهطور کامل درک نکردهاید.»
روش کار و برنامهنویسی هوش مصنوعی
اون در ادامهی مقاله داستانی را تعریف میکند که در آن، جزییات شناختن دوستی پس از ۲۰ سال دوری را شرح میدهد. او در داستان خود توضیح میدهد که چگونه پس از گذشت این همه سال، با دیدن دوستی در مسیر پیادهروی، حتی باوجود تغییرات متعدد در ظاهر، او را شناسایی کرده است.
نامگذاری روی چهرهها مانند فرمولسازی تئوریهای توطئه، نیاز به شناسایی الگوها دارد. برخی افراد در این بخش ضعیف هستند و همسر، فرزند و حتی خودشان را هم بهخوبی در عکسها تشخیص نمیدهند. درمقابل، برخی افراد مهارت بالایی در تشخیص الگوها دارند.
نیروی پلیس اسکاتلندیارد در جریان شناسایی دو محکوم به قتل یک جاسوس روسی و دخترش، از افرادی با عنوان Super Recognizers استفاده کرد. این افراد به مهارت فوق طبیعی در تشخیص چهره و بهیادسپاری خصوصیات متفاوت آن دارند. اغلب افراد، در دستهبندی میان گروههای فوق جای میگیرند.
روند تحقیقات روی شناسایی افراد در تصاویر با استفاده از کامپیوتر، در دهههای ۶۰ و ۷۰ میلادی شروع شد. چالش اولیه آن بود که کامپیوتر بتواند وجود چهره را در یک عکس تشخیص دهد. چالش بعدی در سالهای آینده ایجاد شد و آن، تشخیص چهرههایی بود که در حالت مناسبی ثبت نشده بودند. یک روش برای حل این چالش، سخت مدلهای سهبعدی از سر انسان و نرمالسازی چهرهها با زوایای مختلف در عکس بود.
یکی از نقاط عطف تاریخ تشخیص چهره، عرضهی واحدهای پردازش گرافیکی بود
یکی از نقاط عطف اصلی در تاریخ بینایی کامپیوتری، معرفی اولین پردازشگرهای گرافیکی یا همان GPU در دو دهه قبل برای کامپیوترهای شخصی بود. البته واحدهای پردازش گرافیکی ابتدا برای گیمرها طراحی شدند؛ اما بهقدری در انجام محاسبات تکراری در برخی حوزههای عالی بودند، که محققان هوش مصنوعی آنها را به کار گرفتند.
اغلب سیستمهای تشخیص چهرهی امروزی، از فناوری بهنام شبکهی عصبی استفاده میکنند. این شبکهها کمی متفاوت از برنامههای سنتی برنامهنویسی شدهاند. بهعنوان مثال برای برنامهنویسی این شبکهها، کدهایی برای شناسایی رنگ مو یا طول بینی نوشته نمیشد. بهجای آن، شبکهی عصبی با دیدن و مطالعهی نمونههای فراوان و متضاد، آموزش میبیند و آنها را در سطح پیکسلی با هم مقایسه میکند.
هوش انسانی، وظیفهی تربیت و آموزش شبکهی عصبی را بر عهده میگیرد. هر زمان که هوش مصنوعی دچار اشتباه شود، پارامترهای گوناگون آن توسط متخصصان بهینهسازی میشود. البته در برخی سطحها، الگوریتمها مشخص میکنند که کدام شباهت و تفاوت قابلتوجه است. بههمین خاطر، شبکههای عصبی برخی اوقات بهنام جعبهی سیاه شناخته میشوند.
اون در جریان نگارش مقاله با یکی از مدیران آزمایشگاه بینایی کامپیوتری دانشگاه ماساچوست در آمهرست دیدار کرده است. اریک لرند میلر یک دانشمند عاوم کامپیوتر بوده که سالها روی بینایی کامپیوتری تحقیق کرده است. او اعتقاد دارد بسیاری از توسعههای پیشگام حوزهی هوش مصنوعی و بینایی کامپیوتری در چند سال اخیر ایجاد شدهاندو
میلر در توضیح ظرفیتهای کنونی در حوزهی بینایی بصری، در دسترس بودن پایگاههای دادهی عظیم از تصاویر کامپیوتری را مثال میزند. میلر در اینباره میگوید:
تصور کنید که به سال ۱۹۱۸ رفتهاید و یک سیستم قوی شبکهی عصبی را به فردی معرفی میکنید. شما میگویید که این سیستم تنها با دیدن چند میلیون تصویر چهره، بینایی کامپیوتری را خواهد آموخت. قطعا اختراع شما در آن زمان خارقالعاده محسوب میشود، اما این تعداد عکس از چهرهی افراد، تنها امروز و آن هم با دسترسی ساده به اینترنت قابل دسترسی است.
میلر یکی دیگر از قابلیتهای مفید ایجاد شده در سالهای اخیر را توانایی افزودن هویت به تصاویر در مراکز دادهی بزرگ میداند. چنین قابلیتی در سرویسهایی همچون Amazon Mechanical Turk قابل دسترسی است. در این سرویس، برخی کارهای تکراری که انسانها آن را بهتر انجام میدهند، با هزینههای پایین انجام میشود. بهعنوان مثال کارهایی همچون نوشتن متن از روی صدا یا تشخیص تصاویر مناسب برای شبکههای اجتماعی در چنین سرویسهایی توسط انسانها و با هزینههای نسبتا پایین انجام میشود. استارتاپ کاینثوس نیز از سرویسهای مشابه استفاده میکند.
این استاد دانشگاه ماساچوست در سال ۲۰۰۷ از قابلیتهایی مشابه موارد بالا برای ایجاد پایگاههای دادهی مرجع استفاده کرد. این پایگاه با نام Labeled Faces in the Wild بعدها توسط شرکتهای بزرگی همچون فیسبوک، گوگل و تنسنت برای آموزش شبکهی عصبی استفاده شد.
بهبود شبیهسازی در پردازندههای گرافیکی، کامپیوترها و شبکههای عصبی، یکی از قابلیتهای مهمی است که موجب پیشرفتهای سریع در حوزهی بینایی کامپیوتری شده است. پیشرفتهای مذکور از حدود سال ۲۰۱۲ به دنیای فناوری معرفی شدند و بعدها اختراعاتی همچون فیس آیدی اپل، رانندهی خودکار تسلا و یادگیری عمیق، دراثر آن پدید آمدند.
پلیس نیویورک جزییات فرایندهای تشخیص چهرهی خود را منتشر نمیکند
اون برای ادامهی تحقیقات خود سفری به آزمایشگاه آیبیام واتسون داشت و با مدیر بخش هوش مصنوعی آن یعنی جان آر. اسمیث دیدار کرد. اسمیث در این دیدار دربارهی یک پروژهی بینایی کامپیوتری برای تشخیص سرطان پوستی ملانوما توضیح داد.
متخصصان پوست برای تشخیص ملانوما از پارامترهایی حفظی استفاده میکنند. مواردی همچون شکل نامتقارن لکهی پوستی، مرزهای نامشخصی، چندرنگ بودن و پیشرفت در طول زمان، نشانههایی از این سرطان در نظر متخصصان پوست محسوب میشود. آزمایشگاه IBM تمامی این موارد را کنار گذاشت و بهجای آن، دیتابیسی از تصاویر سرطانی و غیرسرطانی ایجاد کرده و آن را برای یادگیری عمیق الگوریتم استفاده کرد.
اسمیث میگوید زمانیکه از پارامترهای انسانی برای آموزش هوش مصنوعی استفاده نمیکنیم، نتایج بهتری حاصل میشود. وقتی الگوریتمهای آزمایشگاه آیبام برای تشخیص سرطان ملانوما استفاده شد، دقت آن بهصورت کلی بیشتر از متخصصان پوست بود.
یکی از پروژههای جالب آزمایشگاه آیبیام با هوش مصنوعی، گلچینی از ویدیوهای ورزشی را تنها باتوجهبه پارامترهایی خاص ایجاد کرده است. این گلچین، با تحلیل مواردی همچون تشویق تماشاچیان، هیجان صدای گزارشگر، خوشحالی تیمی بازیکنان و حتی موقعیت خط سه امتیازی بسکتبال، از تصاویر خام ورزشی ایجاد شد. محققان از سرویس مذکور برای ایجاد گلچینی از مسابقات تنیس زنان استفاده کردند و نتیجه، به جز یک بخش کوچک از یک مسابقه، عالی بود.
در ارتباط با استارتاپ کاینثوس، یکی از تجهیزات و قابلیتهای در دست توسعهی آنها، عینک واقعیت مجازی برای مشاهده و بررسی دامها توسط صاحبان مزرعه است. این عینک در مراحل توسعه قرار دارد و پس از نهایی شدن، به دامدار امکان میدهد تا از راه دور، رفتار دامها و شرایط سلامت و خوراک آنها را بهصورت انفرادی بررسی کند.
تشخیص چهره و ردگیری دامها، شناسایی و پیشگری از بیماری را در آنها آسان میکند
یکی از متخصصان کاینثوس دربارهی فواید پیادهسازی سیستم بینایی کامپیوتری برای دامداریها، از رفتار این حیوانات میگوید. گاوها طبیعتا موجوداتی کمتحرک هستند و بیماری، میتواند بهراحتی آنها را از پای در بیاورد. بهعلاوه آنها به انسان به چشم دشمن نگاه میکنند و بسیاری اوقات، بیماری خود را نیز از آنها پنهان میکنند. یک سیستم نظارتی از راه دور و بررسی بدون حضور فیزیکی، شناسایی بیماری و درمان آن را سریعتر و کاربردیتر میکند.
نژادپرستی و تعصب هوش مصنوعی
جوی بولاموینی محقق MIT Media Lab در سال ۲۰۱۶ در یک سخنرانی تدکس، اشارهی جالب توجهی به سیستمهای کامپیوتری و بینایی آنها داشت. او از تجربهی خود در ارتباط با سیستمهای بینایی کامپیوتری گفت که چهرهاش را بهخاطر سیاهپوست بودن، حتی بهعنوان چهره تشخیص نمیداد. تجربهی جوی دو بار به این شکل تکرار شده بود و او اعتقاد دارد هوش مصنوعی، نمادی از تعصب خودآگاه و ناخودآگاه طراحان و توسعهدهندگان خود هستند.
این محقق MIT، تعصب هوش مصنوعی را با اصطلاح Coded Gaze معرفی میکند. کلمهی Gaze بهمعنای خیره شدن و اشارهای به رفتارهای نژادپرستانه یا تعصبی نسبت به رنگینپوستان محسوب میشود. تصور میشود که هوش مصنوعی و ماشینها، تعصبها و نژادپرستیهای انسانی را نداشته باشند اما تا امروز نشانههای امیدوارکنندهای از آنها دیده نشده است.
جوی تلاشهای متعددی برای ازبینبردن تعصب در هوش مصنوعی و سیستمهای مشابه دارد. پروژهی او با نام Gender Shades نشان میدهد زنان رنگین پوست بیش از مردان سفید پوست توسط سیستمهای بینایی کامپیوتری تجاری اشتباه گرفته میشوند. او بنیاد Algotithmic Justive League را راهاندازی کرد تا با روشهای گوناگون، تعصبهای موجود در هوش مصنوعی را شناسایی کرده و از بین ببرد.
نیروی پلیس نیویورک از سال ۲۰۱۲ سیستمی با نام Domain Awareness System بهکار گرفت که بهکمک مایکروسافت توسعه یافته است. این سیستم از چندین دوربین نظارتی عمومی و چندین دوربین متعلق به کسبوکارهای خصوصی استفاده میکند. کلیر گاروی عضو ارشد مرکز تحقیقات فناوری و جریم خصوصی در دانشگدهی حقوق جورجتاون، در مصاحبهای با اون دربارهی فناوری مورد استفاده توسط NYPD گفت: «پلیس نیویورک هیچ اطلاعاتی دربارهی فناوری مورد استفادهی خود با ما در میان نمیگذارد».
تنها پس از شکایت دانشکدهی حقوق جورجتاون از دپارتمان پلیس نیویورک، این مرکز، اسنادی را در اختیار دانشگاه قرار داد. اسناد ارائه شده، دو سال قبل از سوی دانشگاه درخواست شده بودند. درمقابل، پلیس سندیگو اطلاعات کاملی دربارهی سیستم بینایی کامپیوتری خود در اختیار عموم قرار میدهد و حتی جلساتی عمومی برای توضیح آن دارد.
شورای شهر سیاتل، سال گذشته طرحی را ارائه کرد که به موجب آن، سیستمهای نظارت شهری باید افشاسازی شوند. امسال، آنها رای به حذف شبکهای از دوربینها و تجهیزات ردگیری گوشیهای همراه دادند که در سال ۲۰۱۳ نصب شد. بههرحال برخلاف این شهر، اکثر شهرهای بزرگ آمریکا هیچ اطلاعاتی دربارهی سیستمهای نظارتی خود منتشر نمیکنند. هیچ قانون فدرالی شهرها را مجبور به ارائهی اطلاعات دربارهی سیستمهای نظارتی نمیکند و تنها فعالان حقوق بشر مانند گاروی، قابلیت کسب اطلاعاتی (آن هم کلی) از شهرها دارند.
گاروی فارغالتحصیل حقوق بوده و فعالیتهای متعددی در جهت مقابله با شناسایی چهرهی غیرقانونی توسط پلیس داشته است. او اعتقاد دارد قوانین آمریکا به پلیس اجازه میدهد تا در دیتابیسهای مدارک و تصاویر شهروندان جستوجو کند. بهعلاوه احتمال استفاده از تصاویر در آموزش سیستمهای بینایی کامپیوتری نیز وجود دارد.
هماکنون پدیدهای بهنام استفادهی غیرقانونی از بینایی کامپیوتری و تشخیص چهره وجود ندارد؛ چون هنوز قانونی برای مرزبندی این کاربردها تصویب نشده است. بههرحال گاوری اعتقاد دارد اگر تصویر افراد در دیتابیسهای قابل دسترسی موجود باشد (که به احتمال زیاد هست)، پلیس در هر بار جستوجو، آنها را نیز بهعنوان مذنون بررسی خواهد کرد. البته گاوری به ظرفیتهای بالای بینایی کامپیوتری اعتقاد دارد اما لزوم قانونمند کردن آنها را تذکر میدهد.
دیتابیس تصاویر اشخاص امروزه بهراحتی از شبکههای اجتماعی بهدست میآید
در کانادا و اروپا، قوانین حریم خصوصی، شبکههای اجتماعی را از ارائهی خدمات تگ کردن اتوماتیک تصویر افراد، منع کردهاند. گاروی و همکارانش در پی تصویب چنین قانونهایی در آمریکا، یک پیشنهاد چهارده صفحهای به مقامات ارائه کردند. در این بیانیه، درکنار موارد دیگر از مقامات امنیتی درخواست میشود که تصاویر متهمان پروندهها را پس از اعلام بیگناهی آنها، از دیتابیس افراد دستگیرشده، پاک کنند. نسخهی اولیهی بیانیه در سال ۲۰۱۶ منتشر شد اما تا به امروز هیچ اقدام قانونی در ارتباط با آن انجام نشده است.
مردم امروزی که با شبکههای اجتماعی بزرگ شده و با آنها اخت گرفتهاند، تاحدودی مفهوم حریم خصوصی را بهمعنای واقعی بیربط میدانند. البته، حتی آنهایی که بیش از همه زندگی خود را به اشتراک میگذارند هم باید نگران باشند. چهره، برخلاف اثر انگشت یا خصوصیات عنبیهی چشم، بدون اطلاع خود افراد قابل اسکن و استفاده در سیستمهای نظارت از راه دور است.
گاروی دربارهی تشخیص چهره توسط نیروهای امنیتی مثال جالبی دارد. در یک تظاهرات اعتراضی اگر نیروی پلیس از افراد بخواهد که کارت شناسایی خود را نشان دهند، قطعا آنها میترسند (و این کار را انجام نخواهند داد). درحالیکه چهرههای افراد و اسکن آنها توسط دوربینهای نظارتی، پیامدی مشابه همین اتفاق دارد.
سیستمهای بینایی کامپیوتری به پلیسها و کارفرمایان امکان میدهند که رفتار و حرکتهای افراد را حتی خارج از حوزهی اختیارات و قانون بررسی کنند. بهعنوان مثال آنها با استفاده از فناوری میتوانند محل تفریح کردن مردم پس از کار، فعالیتهای خیریه یا حتی نشانههایی از بیماری را با تحلیل رفتارهای شخصی، شناسایی کنند. تیم کوک، مدیرعامل اپل در کنفرانسی با موضوع حریم خصوصی در ماه اکتبر (مهر) گفت:
اطلاعات شخصی ما، از رفتارهای روزمره تا خصوصیترین موارد، در سطوح نظامی و با دقت بالا علیه خودمان استفاده میشود.
در ماه می سال جاری میلادی (اردیبهش ۹۷)، چهلویک سازمان غیرانتفاعی ازجمله ACLU و بنیاد خط مقدم الکترونیک، در نامهای سرگشاده به جف بزوس، مدیرعامل آمازون از او درخواست کردند که فروش فناوری تشخیص چهرهی شرکت خود موسوم به Rekognition را به دولت و آژانسهای دولتی متوقف کند. دو ماه پس از ارسال نامه، سازمان ACLU آزمایشی روی سیستم تشخیص چهرهی آمازون انجام داد و برخی از اشکالات آن را فاش کرد.
در آزمایش سیستم تشخیص چهرهی آمازون، بیستوهشت نفر از اعضای کنگرهی آمریکا با چهرههای مظنونین در دیتابیس دستگیرشدگان برابر دیده شد. تعداد زیادی از افراد، اعضای سیاهپوست فراکسیون سیاه کنگره بودند که نمونهای دیگر از تعصب برنامههای کامپیوتری را نشان میدهد.
آمازون به آزمایشهای انجام شده توسط ACLU اعتراض کرد. آنها معتقد بودند تنظیمات سازمان غیرانتفاعی برای انجام آزمایش، پایینتر از استانداردهایی تنظیم شده است که عموما به سازمانهای امنیتی پیشنهاد میشود. اما نکتهی واضح آن است که هیچ قانونی برای اجبار پلیس به تنظیمات صحیح در این سیستم وجود ندارد.
تحقیقات یک سازمان غیرانتفاعی بریتانیایی با هدف آزادی حقوق شهروندی به نام Big Brother Watch روی سیستمهای نظارت تصویری در لندن، نتایج قابل توجهی را بههمراه داشت. تحقیقات مشخص کرد که سیستم اتوماتیک مورد استفادهی پلیس شهر لندن، نرخ مثبت کاذل ۹۸درصد دارد. در این مورد، نرخ مثبت کاذب بهمعنای اشتباه در تشخیص افراد گناهکار و بیگناه میشود. بهعلاوه، پلیس لندن تصویر بسیاری از شهروندان بیگناه را برای تحقیقات آتی نزد خود نگه میدارد.
یکی از منابع آگاه به توسعهی سیستم نظارت تصویری پلیس نیویورک گفته بود که برای بهبود تصاویر نظارتی، چشمهای برخی مجرمان را با چشمهای افراد عادی جابهجا میکرده است. بهعنوان مثال وقتی چشمهای مجرمی در یک تصویر مناسب نبود یا بسته شده بود، این جابهجایی انجام میشد. گاروی میگوید چشمها یکی از مهمترین بخشهای صورت هر فرد هستند و چنین رویکردی در دپارتمان پلیس، مانند آن است که نیمی از اثر انگشت مجرم را خودتان نقاشی کنید!
گاروی و بولاموینی اعتقاد دارند برخی کاربردهای شناسایی کامپیوتری باید بهطور کامل ممنوع شوند. بهعنوان مثال استفاده از شناسایی زندهی چهره در دوربینهای مخصوص بدن پلیسها، از نظر این کارشناسان نامناسب است. دوربینهای بدنی پلیسها عموما برای تشخیص زودهنگام خشونت از طرف مجرمان یا در مواقع دستگیری اشتباه پلیسها، استفاده میشود.
کارشناسان معترض در استفادهی بدون چارچوب از سیستمهای تشخیص چهره اعتقاد دارند که در اکثر آنها، یک تحلیلگر انسانی وجود دارد که در جایی، زمان کافی را برای مشاهدهی تصاویر و مقایسهی آنها با یکدیگر داشته است. اما در دوربینهای بدنی پلیسها، همهی اتفاقات در یک لحظه میافتد و پس از اعلام خطر (صحیح یا غلط) به پلیس، او در یک لحظه تصمیمی میگیرد که از اسلحهی خود استفاده کند.
شرکت axon یکی از بزرگترین تولیدکنندگان دوربینهای بدنی پلیس محسوب میشود. این شرکت، استارتاپهای فعال در هوش مصنوعی با نامهای Dextro و misfit را خریداری کرد تا دوربینهای خود را توسعه دهد. چند سازمان غیرانتفاعی و مدافع حقوق بشر در نامهای سرگشاده به شرکت درخواست کردند که الگوریتمهای زندهی تشخیص چهره را در دوربینهای خود به کار نگیرد. به اعتقاد متخصصات منتقد، پایان دادن به زندگی افراد مسئلهای نیست که بتوان به هوش مصنوعی در آن اعتماد کرد. بهعلاوه، باتوجهبه وضعیت کنونی فناوری، تکیه کردن به آن نوعی بیمسئولیتی تلقی میشود.
آیا باید نگران باشیم؟
استفاده از بینایی کامپیوتری برای شناسایی یک دام در میان گله، بسیار آسانتر از شناسایی یک انسان ناشناس در تصویر دوربینهای نظارتی است. یک دلیل آن است که کشاورز میداند برای هر دام، تصویری دقیقا برابر با آن در دیتابیس وجود دارد. بهعلاوه، راههای متعددی برای تشخیص بصری دام وجود دارد. بهعنوان مثال استارتاپ کاینثوس از ویژگیهای متعددی همچون مو یا خالهای بدن و صورت نیز برای شناسایی گاوها استفاده میکند. بهعلاوه، برچسبهای شمارهگذاریشده روی گاوها نیز در تشخیص آنها توسط دوربینها کارگشا هستند.
همهی المانهای تشخیص چهرهی دامها در همهی شرایط قابل دیدن نیستند، اما هر یک از آنها به تأیید دیگر پارامترها کمک میکنند. درنهایت، سیستم میتواند یافتههای خود را چندباره تأیید کند. بهعلاوه، زمانیکه صورت دام بهطور کامل مشخص نیست، میتوان آن را با المانهای دیگر ردگیری کرد. کاینثوس امید دارد که روزی حیوانات را با روش راه رفتن نیز تشخیص دهد. نوع راه رفتن نیز مانند چهره، خصوصیتی منحصر بهفرد محسوب میشود.
چین، نزدیک به دویست میلیون دوربین نظارتی عمومی دارد که از هر کشور دیگر در جهان، بیشتر است. این کشور در سال ۲۰۱۵ اعلام کرد که قصد دارد تا سال ۲۰۲۰ سیستمی یکپارچه برای کنترل افراد پیادهسازی کند. سیستمی که نظارت را همیشگی، جامع و گسترده خواهد کرد. شناسایی زنده و قابل اعتماد بیش از یک میلیارد نفر از روی چهره، هنوز ممکن نیست، اما چین فقط به شناسایی چهرهای محدود نخواهد شد.
میلر در ارتباط با سیستم نظارت تصویری چین توضیح میدهد:
تصور کنید شما یک شهروند چینی هستید و آدرس منزلتان توسط دولت ضبط شده است. درنتیجه وقتی آنها فردی شبیه به شما را در شهر شیآن میبینند و آدرس خانهی شما نیز در این شهر ثبت شده باشد، احتمالا او را بهعنوان شما تشخیص خواهند داد.بهعلاوه، وقتی دولت تلفن هوشمند شما را ردگیری کند و بداند که ۲۰ دقیقهی پیش در یک رستوران بودهاید، تشخیص چهره دقیقتر خواهد شد.
سیگنالهای تلفن همراه و تراکنشهای مالی، توسط سازمانهای متمرکز در چین کنترل و نظارت میشوند. این موارد، شبیه به برچسب روی گوش دامها هستند که دقت شناسایی تصویری کامپیوتری را افزایش میدهند. میلر اعتقاد دارد چینیها بهسرعت درحال پیشرفت دادن فناوریهای خود و هماهنگتر کردن آنها هستند. میلر با سناریویی پارنویاگونه، رفتار مأموران نظارتی چین را اینگونه توضیح میدهد:
مقامات چینی امروز میتوانند بگویند: هی، این مرد امروز صبح در استارباکس صبحانه خورد و الآن نیز به فروشگاه مکدونالد رفت. او رفتارهای آمریکایی زیادی دارد. باید از او بازجویی کنیم.
زمانیکه سیستم نظارت تصویری چین کامل شود، آنها میتوانند سیستم امتیازدهی اجتماعی اجباری خود را اجرا کنند. سیستم مذکور در چین، ارزش افراد را با فاکتورهای قابل اندازهگیری و نظارت همچون خریدها (آیا بیشازحد نوشیدنی میخورند؟)، تفریحها (آیا بیشازحد بازی ویدئویی انجام میدهند؟) و حتی دوستان آنلاین مشخص میکند. درحالحاضر یک نمونهی داوطلبانه از این سیستم در چین اجرا میشود.
افرادی که بهصورت داوطلبانه در سیستم امتیازدهی اجتماعی چین شرکت کرده و امتیازهای بالایی دریافت میکنند، فرصتهایی همچون دسترسی به شغل، وام یا حتی سفرهایی دارند که دیگر مردم از آن محروم هستند. با اجرای برنامههای اینچنینی آن برچسبهای روی گوشی مجازی نیز گستردهتر میشوند.
بیایید مروری کلی بر برنامههای نظارتی کنونی داشته باشیم. بهعنوان مثال، پلیس نیویورک، پلاک ماشینهای ورودی به و خروجی از شهر، گوگل، تمام مکانهایی که بازدید کردهایم و چین، با استفاده از فناوری تشخیص قدم زدن اختصاصی خود، انسانها را کنترل میکنند. یکی از توسعهدهندگان فناوری تشخیص راه رفتن چین ادعا میکند این سیستم، با مواردی همچون لنگیدن یا هرگونه تغییر روش راه رفتن، فریب نمیخورد.
آمریکاییهای شاید تصور کنند که هیچگاه نصب میلیونها دوربین نظارتی را تحمل نکنند اما شاید چنین اتفاقی بدون اطلاع آنها بهمرور رخ دهد. بهعنوان مثال اکثر ما به گستردهتر شدن خودروهای خودران علاقه داریم اما توسعهی آنها در همهی شهرهای جهان، بهمعنای وجود چشمهای اینترنتی در همهجا میشود.
دوربین خودروهای خودران برای جلوگیری از برخورد با موانع استفاده میشود. البته هر دوربین،قطعا اشخاص اطراف خود را نیز بهخوبی تشخیص میدهد. ازطرفی، بسیاری از خوردوهای خودران، اطلاعات مکانی و دادههای رانندگی را بهصورت دائم ذخیره میکنند و در دورههای زمانی منظم آنها را در سرورهای شرکت سازنده، بارگذاری میکنند.
چین هماکنون از تمامی خودروهای برقی حاضر در کشور درخواست میکند که اطلاعات خود را به سیستمهای نظارتی دولتی ارسال کنند. راس،همبنیانگذار استارتاپ کاینثوس اعتقاد دارد اگر امروز چین به این مرحله رسیده است، دستیابی به قانون و فناوری دریافت اطلاعات تصویری هم ممکن خواهد بود.
فناوری تشخیص چهره، بسیار سریعتر از منتقدان و افرادی حرکت میکند که نگران آیندهی آن هستند. بهبیاندیگر توسعهی آن بهحدی سریع است که متخصصان نمیتوانند راههای مقابله و مدیریت آن را پیدا کنند. بهعلاوه، درحالحاضر فاصله بین اهداف دانشمندان و متخصصان و درک انسانهای عادی از فناوریها، روزبهروز افزایش پیدا میکند.
فناوری تشخیص چهره، سریعتر از منتقدان خود و افراد هادی پیشرفت میکند
میلر که خود در صنعت هوش مصنوعی فعالیت میکند، پس از ملاقات و ارتباط بیشتر با بولاموینی، تعهد بیشتری نسبت به مسائل حریم خصوصی و عدالت پیدا کرد. البته او هنوز درحال یادگیری و بهکارگیری مفاهیم اولیه است. این دانشمند هوش مصنوعی دربارهی پروژههای جدید خود پیرامون حوزهی فعالیت، از سفارش وزارت دفاع آمریکا میگوید که با هدف افزایش عقلانیت هوش مصنوعی و بهبود حل مشکل توسط آن انجام میشود. وزارت دفاع آمریکا همیشه از پشتیبانان اصلی تحقیقات بینایی کامپیوتری بوده است.
این دانشمند هوش مصنوعی بهتازگی با همکاری سه نفر از دانشجویانش، مقالهای را در کنفرانس بینایی کامپیوتری در مونیخ ارائه کرد. نتیجهی مقاله، بهبود شبکههای عصبی در اصلاح اشتباهات است. بهطور خلاصه فناوری مورد نظر میلر از مقایسهی فریمهای متوالی در فیلمها، برای بررسی اشتباهات و تشخیصهای غلط استفاده کرده و آنها را اصلاح میکند.
اشتباهات اصلاح شده در الگوریتم جدید، خود موضوع آموزش موارد بعدی میشوند. درنتیجه، احتمال اشتباه در موراد آتی کاهش پیدا میکند. صحبت میلر دربارهی فناوری جدید و شگفتزدگی او از پیشرفت آن، حسن ختامی برای این مقاله محسوب میشود:
قابلیتهای فناوری جدید من را هیجان زده میکند چون بدون دخالت انسان در حال بهبود خود است. البته، این قابلیتها تاحدودی ترسناک هم هستند. تصور کنید: سلام دیوید، اسم من هال است. چطوری؟ من دیشب باهوشتر شدم.