کشف روشی برای خواندن افکار با استفاده از دستگاه MRI
روش ابداعی یک تیم پژوهشی این توانایی را دارد که از ضبطهای مغزی تصویربرداری تشدید مغناطیسی کاربردی (اختصاراً fMRI) برای بازسازی زبان انسان بهصورت پیوسته استفاده کند. کار اخیر نخستین نمونه در نوع خود بهشمار میرود. این یافتهها بهمنزلهی گامی جدید در مسیر جستجو بهدنبال رابطهای بهتر میان مغز انسان و کامپیوتر محسوب میشود. چنین رابطهایی میتوانند بهعنوان یک فناوری کمکی برای کسانی توسعه یابند که امکان صحبت یا تایپ کردن به شکل متداول را ندارند.
در مقالهای که ۲۹ ماه سپتامبر بهصورت پیشانتشار در پایگاه داده bioRxiv بارگذاری شده، تیمی در دانشگاه آستین تگزاس «رمزگشا» یا الگوریتمی را توضیح میدهند که توانایی «خواندن» کلماتی را دارد که فرد در طول اسکن مغزی از نوع تصویربرداری تشدید مغناطیسی عملکردی (fMRI)، شنیده یا به آنها فکر کرده است. درحالیکه تیم های دیگر پیش از این موفقیتهایی را در بازسازی زبان یا تصاویر براساس سیگنالهای ایمپلنت در مغز گزارش کرده بودند، سیستم رمزگشای جدید اولین رویکردی است که از یک روش غیرتهاجمی برای انجام این کار استفاده میکند. الکساندر هوث، عصبشناس دانشگاه آستین تگزاس و یکی از نویسندگان این مطالعه میگوید:
اگر بیست سال پیش از هر عصبشناس شناختی در جهان میپرسیدید که آیا این کار شدنی است یا خیر، آنها به شما میخندیدند.
یوکیاسو کامیتانی، عصبشناس محاسباتی در دانشگاه کیوتو که در این تحقیق شرکت نداشته، در ایمیلی به پایگاه The Scientist اظهار میکند که دیدن توالیهای زبانی قابل فهم تولیدشده از یک رمزگشای غیرتهاجمی برایش بسیار «هیجانانگیز» بوده است و اینکه «این مطالعه، زمینهای محکم برای توسعهی برنامههای [رابط مغز و رایانه] ایجاد میکند».
نباید فراموش کنیم که استفاده از دادههای fMRI برای چنین تحقیقاتی اساساً کاری دشوار است؛ زیرا سرعت عملکرد سیستمهای دادهی fMRI در مقایسه با سرعت افکار انسان نسبتاً کند است. دستگاههای MRI بهجای تشخیص و دنبال کردن کارکرد نورونها که در مقیاس میلیثانیه اتفاق میافتد، تغییرات جریان خون در مغز را بهعنوان نمایندهای از فعالیت مغز اندازهگیری میکنند. چنین تغییراتی چند ثانیه طول میکشد. بهگفتهی هوث، دلیل کارآمدی روش یادشده در تحقیق اخیر این است که سیستم ابداعی، زبان را نه بهصورت کلمهبهکلمه، بلکه به صورت سطح بالاتر و در قوارهی یک جمله یا فکر تشخیص داده و رمزگشایی میکند.
هوث و همکارانش الگوریتم خود را با اتکا به ثبتهای مغزی fMRI توسط هوش مصنوعی تمرین دادند. سوژههای مطالعاتی آنها یک زن و دو مرد (همگی در دهههای سوم یا چهارم زندگی) را شامل میشد. آنها به ۱۶ ساعت پادکست و داستانهای رادیویی گوش دادند. برنامههای بعضاً شناختهشدهای همچون The Moth Radio Hour، تد تالک و John Green's Anthropocene Reviewed از جمله رسانههای مورد استفاده در این آزمایش بودند. بهگفتهی هوث، در مسیر ساخت یک رمزگشای دقیق و با امکان کاربرد گسترده، مهم است که افراد شرکتکننده در تحقیق به طیف وسیعی از رسانهها گوش دهند. او خاطرنشان میکند که مقدار دادههای fMRI جمعآوریشده با اکثر مطالعات دیگری که از ضبطهای fMRI استفاده میکنند، مطابقت دارد؛ اگرچه او سوژههای تحقیقاتی کمتری دراختیار داشت.
سیستم رمزگشا براساس آموزش ۱۶ ساعتهی ضبط fMRI مغز فرد، مجموعهای از پیشبینیها را از ظاهر خوانشهای fMRI انجام داد. بهگفته هوث، استفاده از این «حدسها» کلید تضمین و تأییدی بر این نکته بود که رمزگشا میتواند افکاری را ترجمه کند که لزوماً به یکی از ضبطهای صوتی شناختهشدهی استفادهشده در طی تمرین توسط هوش مصنوعی مربوط نیستند. سپس این «حدسها» دربرابر ضبط زمان حقیقی fMRI بررسی شدند و درنهایت پیشبینی که با خوانشهای واقعی fMRI مطابقت بیشتری داشت، همان کلماتی را تعیین کرد که سیستم رمزگشا در مرحلهی آخر تولید کرده بود.
محققان برای تعیین میزان موفقیت رمزگشا، شباهت نسل رمزگشا را با محرکهای ارائهشده به سوژه ارزیابی کردند. آنها همچنین زبان تولیدشده توسط همان رمزگشا را که دربرابر ضبط fMRI بررسی نشده بود، مورد بررسی و امتیازدهی قرار دادند. پژوهشگران پس از آن، نمرات ثبتشده را مقایسه و اهمیت آماری تفاوت بین این دو را آزمایش کردند.
نتایج نشان داد که روش حدس و بررسی الگوریتم در نهایت یک داستان کامل از ضبطهای fMRI ایجاد میکند که به گفتهی هوث، بهشکلی «بسیار خوب» با داستان واقعی روایتشده در ضبط مطابقت دارد. بااینحال، کاستیهایی نیز در الگوریتم وجود دارد. برای مثال، این سیستم در حفظ ضمایر چندان خوب نیست و اغلب ضمایر اول شخص و سوم شخص را با هم اشتباه میگیرد. بنابر بر توضیح هوث، رمزگشا «میداند که چه اتفاقی در حال رخ دادن است؛ اما نمیداند چه کسی این کارها را انجام میدهد».
بهباور سام ناستاسه، محقق و مدرس مؤسسه علوم اعصاب پرینستون، استفاده از ضبطهای fMRI برای این نوع رمزگشایی مغز، «دیوانهکننده» است؛ زیرا چنین دادههایی معمولاً بسیار کند و پر سروصدا هستند. او میافزاید:
آنها با این مقاله نشان میدهند که اگر چارچوب مدلسازی به اندازهی کافی هوشمندانه داشته باشیم، میتوانیم مقدار شگفتانگیزی از اطلاعات را از میان ضبطهای fMRI استخراج کنیم.
بنابر گفتههای هوث و یافتههای تیم او، ازآنجاکه رمزگشا از ضبطهای مغزی fMRI غیرتهاجمی استفاده میکند، درنتیجه پتانسیل بالاتری برای کاربرد در دنیای واقعی نسبت به روشهای تهاجمی دارد. بااینحال هزینه و زحمت استفاده از دستگاههای MRI یک چالش آشکار است. او میگوید:
مگنتوآنسفالوگرافی یا مغناطیسنگاری مغزی، یکی دیگر از تکنیکهای غیرتهاجمی، اما قابل حملتر تصویربرداری مغز به شمار میرود و از نظر زمانی دقیقتر از fMRI است. این تکنیک میتواند بهطور بالقوه با رمزگشای محاسباتی مشابه برای ارائهی روشی برای ارتباط غیرکلامی افراد به کار برده شود.
هوث معتقد است که هیجانانگیزترین مؤلفهی موفقیت رمزگشای آنها به «بینشی» مربوط میشود که از عملکرد مغز به دست میدهد. بهعنوان مثال، وی به بخشهایی از نتایج تحقیقشان درمورد نزدیکتر شدن به پاسخ این پرسش که «کدام قسمتهای مغز مسئول ایجاد معنا هستند؟» اشاره میکند. تیم پژوهشی با استفاده از این سیستم رمزگشا و در طی ضبط دادههای نواحی خاص مانند قشر جلوی مغز یا قشر گیجگاهی جداری، توانستند تعیین کنند که هر کدام از این قسمتهای مغز انسان، نشاندهندهی چه اطلاعات معنایی هستند. برپایهی یکی از یافتههای جالب آنها، دو بخش یادشده از مغز اطلاعات یکسانی را به رمزگشا نشان میدادند و رمزگشا هنگام استفاده از ضبطهای بهدستآمده از هر دوی آن ناحیهها بهخوبی و به شکلی مشابه کار میکرد.
هوث اضافه میکند شگفتانگیزترین جنبهی سیستم اخیر مربوط به توانایی رمزگشا در بازسازی محرکهایی بود که از زبان معنایی استفاده نمیکردند؛ حتی با وجود اینکه در مورد موضوعات گوشدادهشده زبان گفتاری، آموزش داده شده بود. بهعنوان یک مثال برای آشکارتر شدن این عبارت باید اشاره کنیم که الگوریتم دانشمندان پس از یادگیری، معنای موضوعات یک فیلم صامت مشاهدهشده از سوی سوژههای تحقیق را با موفقیت بازسازی کرد. این الگوریتم همچنین تجربهی مبتنی بر تصور یک شرکتکننده از روایت یک داستان را بازسازی کرد. هوث همچنین میگوید:
این واقعیت که آن پدیدهها [در مغز] به مقدار زیادی با هم تداخل دارند، چیزی است که بهتازگی شروع به درکش کردهایم.
نتایج آزمایشگاه هوث (که البته هنوز مورد بازبینی همتا قرار نگرفتهاند) هم از نظر کامیتانی و هم ناستاسه، سوالاتی را پیرامون چگونگی پردازش رمزگشاها درمقابل زبانهای متنی یا زبانهای گفتارمانند، در ذهن پدید میآورد. ناستاسه میگوید:
ازآنجاکه رمزگشای جدید به جای کلمات منفرد، معنا یا معناشناسی واقع در پس جملات را تشخیص میدهد، اندازهگیری موفقیت آن میتواند دشوار باشد، زیرا ترکیبهای متعددی از کلمات میتوانند بهعنوان یک خروجی خوب محسوب شوند. این مسئلهی جالب از کار آنها بیرون آمده است.
هوث تصدیق میکند که شاید بهزعم برخی افراد، فناوریهای اینچنینی که قادر به «خواندن ذهن» هستند، تا حدی وحشتناک یا ترسناک جلوه کنند. وی تصریح میکند که تیم پژوهشی تحت سرپرستیاش عمیقاً درمورد پیامدهای این تحقیق و مسیرهای احتمالی فکر کردهاند و بهدلیل نگرانیهای موجود پیرامون حفظ حریم خصوصی ذهنی، به سراغ بررسی امکان یک موضوع وسوسهبرانگیز نیز رفتهاند: آیا رمزگشا بدون همکاری شرکتکننده کار میکند؟
محققان در برخی آزمایشها و همزمان با پخش صدا، از افراد تحت آزمایش خواستند تا با انجام کارهای ذهنی دیگری همانند شمارش، نامگذاری و تصور حیوانات و تصور گفتن داستانی متفاوت، حواس خود را پرت کنند. آنها در ادامه دریافتند که نامگذاری و تخیل حیوانات در نادرست کردن رمزگشایی مؤثرتر است.
از طرفی از نقطه نظر حفظ حریم خصوصی باید به یک نکتهی مهم توجه کنیم: رمزگشای آموزشدیده در اسکن مغز یک فرد نمیتواند زبان فرد دیگر را بازسازی کند و اساساً هیچ اطلاعات قابل استفادهای را در این مطالعه باز نمیگرداند. از همین روی احتمالاً خودتان نیز متوجه شده باشید که در چنین سیستمی قبل از هرگونه رمزگشایی دقیق از افکار یک انسان، آن شخص بایستی با آگاهی و تصمیم خودش در جلسات آموزشی گسترده شرکت کند.
از نظر ناستاسه، این واقعیت که محققان بهدنبال شواهدی مبنی بر حفاظت از حریم خصوصی ذهنی بودهاند، مسئلهای دلگرم کننده است. وی میگوید:
[آنها] بهراحتی میتوانستند این مقاله را شش ماه پیش بدون هیچ یک از آن آزمایشها [حریم خصوصی] منتشر کنند.
هرچند که او هنوز بهطور کامل با توضیحات نویسندگان مقاله پژوهشی پیرامون اینکه آزمایشهای آنها و سیستم رمزگشا، هیچ جنبهی نگرانکنندهای برای حریم خصوصی ندارد، متقاعد نشده است. از طرفی باید توجه کنیم که تحقیقات آینده احتمالاً خواهند توانست راههایی را برای رفع محدودیتهای حریم خصوصی ذهنی مطرحشده در این تحقیق پیدا کنند و در آن صورت باید نگران باشیم. ناستاسه در انتها توضیح میدهد:
آیا مزایای فناوریهایی از این دست بیشتر از دامها یا خطرات احتمالی آنها است یا خیر؟ این سؤال بسیار مهمی است.