گرفتاری هوش مصنوعی در دام وهم و خیال چه تبعاتی دارد؟
مسافری را تصور کنید که سوار بر یک تاکسی شده است. او نشان توقف را درکنار جاده میبیند؛ اما خودرو برخلاف معمول، سرعتش را زیاد میکند. مسافر دهانش را باز میکند تا با راننده صحبت کند؛ اما بهیاد میآورد که این خودرو، راننده ندارد. درهمین لحظه، قطار شهری بهسمت آنها میآید و با سرعت زیاد به اتومبیل برخورد میکند. درنهایت، مسافر جان خود را از دست میدهد.
داستان بالا کاملا تخیلی بود؛ اما نشاندهندهی نقصی واقعی و حساس در چارچوبهای کنونی هوش مصنوعی است. در سالهای گذشته، مثالهای متعددی از ماشینهایی وجود داشتند که اشیاء و اتفاقات غیرواقعی را میدیدند یا میشنیدند. درواقع، اضافه کردن عامل مزاحم یا بهاصطلاح «نویز» به سیستم این ماشینها، میتوان تواناییهای شناختی آنها را تغییر داد. در تعریف دیگر، ماشینها هم دچار وهم و خیال میشوند.
در بدترین حالات توهم ماشینها، سناریویی شبیه به داستان بالا پیش میآید. در این داستان وحشتناک، چشمان انسانی بهراحتی علامت توقف را میبینند؛ اما ماشین در شناسایی آن دچار مشکل میشود. چنین ایراداتی در سیستمهای هوش مصنوعی، عموما بهعنوان مثالهای دشمنی یا اتفاقات عجیب شناخته میشوند.
آنیش آتالی، یک دانشمند علوم کامپیوتر در MIT دربارهی این روندهای فرضی در هوش مصنوعی و ماشینها میگوید:
این مثالها، مانند ورودیهایی هستند که ما انتظار داریم شبکه، بهیک روش با آنها برخورد کند؛ اما ماشینها حرکتی غیرقابل پیشبینی انجام میدهند.
دیدن اشیاء
اکثر تمرکز تحقیقات در خصوص تواناییهای هوش مصنوعی، به شناسایی و پردازش بصری معطوف بوده است. آتالی در تحقیقات خود نشان داد که میتوان تصویر یک گربه را با هدف به اشتباه انداختن هوش مصنوعی، تغییر داد. پس از این تغییر، چشم انسان هنوز گربه را تشخیص میدهد؛ اما شبکهی عصبی، آن را بهصورت یک ظرف غذا میبیند. شبکهی عصبی، همان الگوریتمهای یادگیری ماشین هستند که اغلب فناوریهای هوش مصنوعی را پیادهسازی میکنند.
هوش مصنوعی هنوز درک کامل و جامعی از آنچه میبیند، ندارد
بهعنوان مثالی از شبکههای عصبی و توانایی تشخیص بصری آنها میتوان به قابلیتهای گوشی هوشمند در تگ کردن دوستان در گالری تصاویر اشاره کرد. این هوش مصنوعی بدون نیاز به کسب اطلاعات از سمت شما، دوستانتان را در تصاویر مشترک پیدا کرده و آنها را برچسبگذاری میکند.
آتالی و تیمش در جدیدترین تحقیقات خود، روی اجسام فیزیکی تمرکز کردند. این گروه تحقیقاتی با کمی تغییر در رنگ و بافت اجسام، توانستند هوش مصنوعی را به اشتباه بیاندازند. در یک مثال، یک توپ بیسبال، بهاشتباه قهوهی اسپرسو تشخیص داده شد. در مثالی دیگر، هوش مصنوعی یک لاکپشت را، اسلحهی خودکار تشخیص داد.
پردازش تصویری هوش مصنوعی، بهاشتباه این تصویر را یک اسلحه تفسیر کرد
اجسامی که باعث بهاشتباه افتادن هوش مصنوعی در این آزمایش شدند، با فناوری چاپ سهبعدی تولید شده بودند. گروه تحقیقاتی توانست این هوش مصنوعی را با ۲۰۰ جسم مختلف بهاشتباه بیاندازد، این اشتباهات، با افزایش استفاده از رباتها در زندگی روزمره، نگرانکنندهتر میشوند. ما امروزه رباتها را در خانههایمان وارد میکنیم، پهپادها را در هوا به پرواز در میآوریم و خودروهای خودران نیز به مرور به خیابانها وارد میشوند. دراینحالت، اشتباهات مذکور، عواقب مرگباری خواهند داشت.
آتالی در ادامهی صحبتهای خود میگوید:
ابتدا به چشم یک کنجکاوی به این پروژه نگاه کردیم. اکنون که مشکلات روشن شدند، افراد به این چالشها بهچشم بحرانهای امنیتی خطرناک نگاه میکنند؛ چرا که چنین سیستمهایی روزبهروز، بیشتر به زندگی ما وارد میشوند.
بهعنوان مثالی ملموس از این رخدادها، خودروهای خودران را در نظر بگیرید؛ پدیدهای جدید که دورههای آزمایشی تجربی خود را تجربه میکند. آنها نیز از شبکههای عصبی برای مسیریابی و تشخیص موانع استفاده میکنند. سال گذشته، محققان ثابت کردند که شبکههای عصبی، با کمی تغییرات در اجسام، دچار اشتباه میشوند. درواقع با جسپاندن چند برچسب روی علامتهایی همچون توقف یا محدودیت سرعت، تشخیص شبکهی عصبی خودروی خودران، به اشتباه میافتد.
با چسباندن چند برچسب روی علامت توقف، توانایی شناسایی آن از سمت هوش مصنوعی از بین میرود
شنیدن صداها
شبکههای عصبی، تنها فریمورکهای یادگیری ماشین کنونی نیستند. دیگر چارچوبها نیز دربرابر چنین اتفاقات عجیبی، آسیبپذیر میشوند، این آسیبپذیری نیز محدود به سیستمهای شناسایی بصری نیست. نیکلاس کارلینی، دانشمند محقق Google Brain (توسعهدهندهی ماشینهای هوشمند) دربارهی اشتباهات شبکهی عصبی و هوش مصنوعی میگوید:
من در هر زمینهای که بررسی میکنم، از دستهبندی تصاویر گرفته تا تشخیص صدا تا ترجمه، شبکههای عصبی ظرفیت اشتباه کردن در دستهبندی ورودیها را دارند.
با کمی نویز در صدا، تفسیر جملات توسط هوش مصنوعی دشوار میشود
کارلینی در یک آزمایش تجربی، کمی صدای مزاحم به پسزمینهی صدا اضافه کرد. با اضافه شدن این عامل اضافی، جملهی without the dataset the article is useless به ok google browse to evil dot com تبدیل شد. این اشتباهات تشخیص صدا، به صحبت کردن و جملات محدود نمیشوند. در یک مثال تجربی، یک قطعه موسیقی باخ برای هوش مصنوعی پخش شده و این جمله دریافت شد: peech can be embedded in Music.
کارلینی باتوجه به یافتهها و مثالهای بالا به این نتیجه رسید که هوش مصنوعی و یادگیری ماشین هنوز حتی در وظایف اولیه نیز نسبت به انسان ضعیفتر است.
محققان با تغییر سادهی جنس یک توپ چاپ شده بهصورت سهبعدی، آن را شبیه به قهوهی اسپرسو تولید کردند
زیر پوست فناوری
شبکههای عصبی تاحدودی براساس توانایی ذهن در پردازش اطلاعات بصری و یادگیری از آن، طراحی شدهاند. در این مورد، روند شناسایی گربه، توسط یک کودک را در نظر بگیرید. هرچه کودک، تعداد بیشتری از این موجودات را میبیند، متوجه شباهتهای آنها میشود. درواقع او میفهمد موجودی با چهار پا که بدنی نرم و پرمو، گوشهای تیز، چشمهای بادامی و دم بلند پرمو دارد، گربه است.
درواقع در کورتکس بصری مغز کودک (بخشی که اطلاعات دیداری را پردازش میکند)، لایههای پیدرپی نورونی وجود دارد که در واکنش به جزییات بصری، فعال میشوند، این جزییات میتواند شامل هرچیزی حتی خطوط افقی و عمودی و خصوصیتهای آنها باشد. درنهایت همین موارد، تصویر کودک را از جهان شکل میدهند.
AI براساس یادگیری با مشاهدهی نمونههای مشابه، طراحی میشود
شبکههای عصبی نیز رویکردی مشابه بالا دارند. داده از بین لایههای پیدرپی نورونهای مصنوعی گذر میکند. هوش مصنوعی که توسط صدها هزار نمونهی آزمایشی مشابه و بهدست انسان آموزش دیده است، پس از مدتی توانایی تشخیص اجسام را پبدا میکند. پیچیدهترین حالت این سیستمهای یادگیری، یادگیری عمیق نام دارد که لایههای بیشتری دارند.
بههرحال، بااینکه دانشمندان علوم کامپیوتر، روش کار شبکههای عصبی را میدانند، اطلاعات کاملی از جزییات روند کار آنها متوجه نمیشوند. آتالی دربارهی این عدم توانایی تشخیص فرایند میگوید:
ما هنوز هوش مصنوعی را بهطور کامل نمیفهمیم. درواقع، دلیل بروز اتفاقاتی همچون مثالهای دشمنی و روشهای حل آنها را نمیدانیم.
بخشی از این مشکلات، به سبک وظایفی مرتبط میشود که فناوریها برای حل آنها ساخته شدند. بهعنوان مثال، میتوان به وظیفهی تشخیص تفاوت سگ و گربه اشاره کرد. ماشین برای این کار، مثالهای متعددی از تصویر سگ و گربه را مشاهده میکند و درنهایت، نقاط دادهی کافی برای تشخیص بین این دو را خواهد داشت.
احتمال دارد که هوش مصنوعی، یک قطعهی موسیقی را بهصورت یک جمله تفسیر کند
الکساندر مدری یک محقق دیگر از دانشگاه MIT است که روی قابلیت اطمینان و امنیت فریمورکهای یادگیری ماشین کار میکند. او دربارهی آموزش هوش مصنوعی میگوید:
هدف اصلی فریمورکهای یادگیری ماشین ما آن است که بهصورت میانگین، بهترین کارایی را داشته باشند. در این حالت وقتی شما سیستم را برای بهرهوری بالا دربرابر اکثر عکسهای سگها بهینهسازی میکنید، همیشه عکسهایی هستند که آن را به اشتباه میاندازند.
یک راهحل احتمالی، آموزش شبکهی عصبی با مثالهایی پیچیدهتر خواهد بود، این راهکار تاحدودی میتواند آنها را دربرابر مثالهای خارج از عرف، مقاوم کند. این روش، از نظر مدری هم قدمی مثبت در مسیر توسعهی هوش مصنوعی خواهد بود؛ البته، اگرچه این رویکرد احتمالا به قویتر شدن سیستمها میانجامد، انجام آن چندان آسان نخواهد بود، چرا که راههای پرشماری وجود دارند که ازطریق آنها میتوان تصاویر و اجسام را دستکاری کرد و سیستم را به چالش کشید.
درک مفهوم شباهت، کمبودی است که هوش مصنوعی از آن رنج میبرد
درواقع، یک سیستم دستهبندی تصویری حرفهای، توانایی شناخت مفهوم شباهت را خواهد داشت، این سیستم بهینه، متوجه میشود که نقاشی یک کودک از گربه، عکس گربه و جسم آن، همگی نشاندهندهی یک موجود هستند. درواقع، شبکههای عصبی باوجود تمامی ظرفیتهای چشمگیر، هنوز خصوصا در تشخیص اجسام، حس داشتن نسبت به محیط و واکنش به اتفاقات پیشبینینشده، از مغز انسان ضعیفتر هستند.
شاید برای اینکه بتوانیم هوش مصنوعی بهتر با قابلیت کارکرد در موقعیتهای دنیای واقعی طراحی کنیم، باید چند قدم به عقب برویم. بهبیان دیگر، باید روند فعالیت مغز انسان را دوباره بررسی کرده و آن را تحلیل کنیم.
مشکل جمعبندی و انسجام اطلاعات
اگرچه شبکههای عصبی براساس کورتکس بصری انسان طراحی شدند، این باور وجود دارد که شباهت این دو به یکدیگر، کاملا سطحی است. یک تفاوت اصلی آن است که مغز ما بههمان خوبی که سطوح و اشیاء را تشخیص میدهد، ارتباط آنها را نیز شناسایی میکند. درواقع ما متوجه میشویم که لبههای جسم، حجم آن را تشکیل میدهند. این قابلیت، به ما امکان میدهد که به الگوهای مشاهده شده، معنا ببخشیم.
سیمون استرینجر، محقق بنیاد تحقیقات نظری علوم عصبی و هوش مصنوعی آکسفورد دربارهی این تفاوت مغز انسان با هوش مصنوعی میگوید:
وقتی من و شما به یک گربه نگاه میکنیم، تمام اجزای تشکیلدهندهی آن و ارتباط آنها با یکدیگر را متوجه میشویم، این اطلاعات شیرازهای همان چیزی است که توانایی ما در حس داشتن نسبت به جهان را ایجاد میکند. درنهایت، هوش جامع ما وابسته به همین توانایی است.
این اطلاعات شیرازهای که بهنوعی بخشهای مختلف داده و اطلاعات را به هم متصل میکند، همان چیزی است که هوش مصنوعی کنونی از کمبود آن رنج میبرد. استرینجر در توضیح این تفاوت میگوید:
اگر مغز انسان هم این جمعبندی اطلاعات را انجام نمیداد، شما بهعنوان مثال متوجه میشدید که یک گربه در جایی از صحنه وجود دارد؛ البته از مکان دقیق آن و اینکه کدام بخشهای صحنه، متعلق به گربه هستند، اطلاعی نداشتید.
مهندسان فعال در صنعت هوش مصنوعی و سازندگان فریمورکهای مصنوعی عصبی، برای سادهتر کردن فرضیات و معادلات، خصوصیتهای متعددی از نورونهای واقعی را حذف کردند. اهمیت این حذف مشخصات، بهتازگی و با رخ دادن مثالهای گفتهشده، روشن شده است.
هر نورون پیامهای مختلف اطلاعرسانی یا واکنش را در طول خود به بدنهی اصلی ارسال میکند. این ارسال دستورها، تأخیر را در ماهیت عملکرد این شبکهها ایجاد میکند. بهعلاوه، در نرخ جابهجایی اطلاعات نیز تفاوتهایی در بین نورونها وجود دارد. برخی از آنها سریع هستند و برخی دیگر عملکرد آهسته دارند. بسیاری از نورونها در ظاهر اهمیت بالایی به زمانبندی پالسهای دریافتی میدهند. درواقع آنها باتوجه به دریافتهای خود، دربارهی زمانبندی یا ارسال و عدم ارسال، تصمیمگیری میکنند.
جفری باورز، یک دانشمند علوم عصبی در دانشگاه بریستول که درحال تحقیق روی قابلیتهایی از مغز است که درحالحاضر توسط شبکههای عصبی اجرا نمیشود. او دربارهی این تفاوتها میگوید:
در شبکههای عصبی مصنوعی، همهی نورونها شبیه به یکدیگر هستند. ازطرفی تنوع موفولوژیک نورونهای مختلف در مغز نشان میدهد که دلیلی پشت این تنوع نهفته است.
تفاوت دیگر، طراحی شبکههای عصبی براساس سیگنالهای متحرک در یک جهت، بین لایههای مختلف خواهد بود. درحالیکه طبق گفتههای استرینجر، در کورتکس انسانی، اتصالات هم از بالا به پایین و هم از پایین به بالا صورت میگیرد.
طراحی شبکهی عصبی براساس ساختار نورونهای مغز، موفقیتآمیزتر است
گروه آزمایشگاهی استرینجر، نمونههای شبیهسازیشده از مغز انسان ایجاد میکند تا روش کار آن را متوجه شود. وقتی این گروه در تحقیقات اخیر خود، شبیهسازیها را بهبود دادند، زمانبندی و ساختار نورونهای واقعی را به بهترین وجه، ترکیب کردند. سپس، این سری از نورونها را با تعدادی تصاویر دیجیتال آموزش دادند. آنها درنهایت، متوجه پیشرفتهای قابلتوجه در پردازش اطلاعات توسط شبکههای جدید شدند.
نورونهای مصنوعی، پس از بهبود ایجادشده دیگر بهصورت همزمان اجرا نشدند. درعوض، آنها الگوهای پیچیدهتر فعالیت را از خود نشان دادند. بهعنوان مثالی از این الگوها، یک زیرمجموعه از نورونهای مصنوعی ایجاد شد که بهعنوان نگهبانان دروازههای داده فعالیت میکرد. درتعریف ساده این نورونها تنها درصورت یکسان بودن سیگنالهای دریافتی از سطوح بالایی و پایینی، فعالیت خود را اجرا میکردند.
استرینجر تصور میکند نورونهای واسط مذکور، شبیه به فعالیت مغز مانند یک سند ازدواج عمل میکنند، این نورونها، ارتباط نورونهای دیگر را رسمیت میبخشند. درواقع، نورونهای نگهبان، مرتبط بودن دو سیگنال در دو طرف خود را تأیید میکنند. برای روشن شدن قضیه کافی است بدانید این قابلیت، به مغز امکان میدهد تا دو خط در گوشهای گربه را، بهعنوان گوشهای آن تشخیص دهد (نه جزئی از جسمی دیگر در صحنه).
استرینجر دربارهی این یافتهها میگوید:
ما اعتقاد داریم که قابلیتهای واسطهای و شیرازهای موجود در بخش بصری مغز که در شبکههای ما هم ظهور پیدا کردند، نقشی مهم در بینایی زیستی دارند، این نقش شامل توانایی فرد در تشخیص اجسام، صورتها و رفتارهای انسانی میشود.
گروه استرینجر درحالحاضر در تلاش برای یافتن نورونهای مشابه در مغز انسان هستند. آنها بهعلاوه درحال توسعهی شبکههای نورونی هیبریدی هستند. احتمالا این شبکههای جدید بااستفاده از یافتههای اخیر، سطح بالاتری از یادگیری ماشین را نشان خواهند داد. باورز نیز اعتقاد دارد وجود یا عدم وجود چنین نورونهایی در مغز هنوز مشخص نیست؛ البته، بههرحال یافتههای اخیر جذاب هستند و احتمالات قابل توجهی را در این علم ایجاد میکنند.
هوش مصنوعی هنوز در تشخیص برخی مفاهیم ساده از انسان عقبتر است
یک آزمایش تجربی روی یافتههای گروه استرینجر، با هدف بررسی توانایی تشخیص شرایط مختلف توسط هوش مصنوعی جدید، انجام خواهد شد. باید مشخص شود که آیا این هوش جدید توانایی تمیز دادن بین حالتهای افتادن، نشستن یا روی زمین گذاشتن چند بسته توسط انسان را دارد؟ استرینجر دربارهی این آزمایش تجربی میگوید:
این چالش، هنوز برای الگوریتمهای کنونی پردازش تصویر، دشوار محسوب میشود. درحالیکه مغز انسان بهراحتی این تفاوت را تشخیص میدهد.
استرینجر علاوهبر تحقیقات فوق، با آزمایشگاهی نظامی در ویلتشایر انگلستان همکاری میکند. هدف از این پروژه، پیادهسازی شبکهی عصبی جدید روی دوربین پهپادهای هوشمند خواهد بود تا تانکها دشمن را تشخیص دهند. هدف نهایی استرینجر، پیادهسازی هوش مصنوعی شبیه به مغز موش روی یک ماشین تعریف میشود. او دورهی زمانی ۲۰ ساله را برای این هدف در نظر میگیرد و اعتقاد دارد پیادهسازی هوش انسانی، یک عمر (یا حتی بیشتر) زمان نیاز دارد.
مدری نیز دربارهی نتایج تحقیقات اخیر، امیدوار است. او میگوید انجام تحقیقات براساس علوم عصبی، رویکردی جذاب برای حل مشکلات کنونی الگوریتمهای یادگیری ماشین خواهد بود. او میگوید:
اکنون دیگر همه میدانند که عملکرد مغز ما، کاملا با مدلهای کنونی یادگیری عمیق، متفاوت است. درنتیجه، تحقیقات جدید میتواند راهی کاملا متفاوت در مسیر موفقیت در این علم ایجاد کند؛ البته، هنوز نمیتوان گفت که یافتههای اخیر چقدر قابل اعتماد هستند. بهعلاوه، زمان مورد نیاز برای رسیدن به موفقیت نهایی نیز مشخص نیست.
بههرحال، تحقیقات برای بهبود هوش مصنوعی و روشهای بهکارگیری آن، در بین دانشمندان با جدیت ادامه دارد. دراینمیان، شاید بهتر باشد که هنوز، اعتماد زیادی به رباتها، خودروها و برنامههای مجهز به هوش مصنوعی نداشته باشیم. خصوصا در مواردی که برخورد مستقیم با انسان دارند، باید جانب احتیاط بیشازپیش رعایت شود. درواقع ما هنوز نمیدانیم که آیا هوش مصنوعی صحیح عمل میکند یا دچار توهم شده است!