هوش مصنوعی ساختار سه بعدی مولکولها را پیشبینی میکند
چند سالی است جان مگگیان، زیستشناس و مدیر مرکز نوآوری آنزیم در پورتسموث انگلیس، به دنبال مولکولی بوده که بتواند ۱۵۰ میلیون تن بطری نوشابه و ضایعات پلاستیکی دیگر را در سراسر جهان تجزیه کند. او با همکاری پژوهشگران در دو سمت اقیانوس اطلس چند گزینه خوب پیدا کرده؛ اما وظیفهی وی بسیار دشوار است: کشف ترکیبات شیمیایی که بهخودیخود به شکلهای میکروسکوپی پیچ میخورند که بتوانند بهطور کامل در مولکولهای سازندهی بطریهای پلاستیکی جای بگیرند و مانند کلیدی که در را باز میکند، آنها را از هم جدا کنند.
این روزها تعیین محتوای شیمیایی دقیق هر آنزیم چالش نسبتا سادهای است؛ اما شناسایی شکل سهبعدی آن شاید به سالها آزمایش بیوشیمیایی نیاز داشته باشد؛ بنابراین پاییز گذشته دکتر مکگیان پس از خواندن مطلبی دربارهی اینکه آزمایشگاه هوش مصنوعی دیپمایند در لندن، سیستمی ساخته است که بهطور خودکار شکل آنزیمها و پروتئینهای دیگر را پیشبینی میکند، از آزمایشگاه مذکور پرسید آیا میتواند به او در زمینه پروژهاش کمک کند. او در اواخر هفتهای کاری، فهرستی از هفت آنزیم را برای دیپمایند فرستاد. دوشنبه بعد، آزمایشگاه اشکال تمام هفت پروتئین را برای او ارسال کرد. دکتر مکگیان میگوید: «این، کار ما را یکی دو سال جلوتر انداخت.» اکنون هر بیوشیمیدانی میتواند به همین شیوه به کار خود سرعت ببخشد.
به گزارش نیویورک تایمز، روز پنجشنبه دیپمایند اشکال پیشبینیشدهی بیش از ۳۵۰ هزار پروتئین را منتشر کرد که سازوکارهای میکروسکوپی هستند که رفتار باکتریها، ویروسها، بدن انسان و تمام موجودات زندهی دیگر را هدایت میکنند. پایگاه داده جدید شامل ساختارهای سهبعدی تمام پروتئینهای بیانشده توسط ژنوم انسان و نیز پروتئینهایی است که در ۲۰ موجود زندهی دیگر ازجمله موش، مگس میوه و باکتری ایکولای بیان میشود.
این نقشه بیولوژیکی دقیق و گسترده که تقریبا ۲۵۰ هزار شکل را ارائه میدهد که قبلاً ناشناخته بود، ممکن است توانایی درک بیماریها را افزایش بدهد و روند ساخت داروهای جدید و تغییر کاربرد داروهای موجود را تسریع کند. دستاورد جدید همچنین ممکن است به ساخت ابزارهای زیستی جدیدی منجر شود؛ مانند آنزیمی که بطریهای پلاستیکی را تجزیه و آنها را به موادی تبدیل کند که بهراحتی مورد استفاده مجدد قرار بگیرند یا بازیافت شوند. گیرا بابا، استادیار گروه زیستشناسی سلولی در دانشگاه نیویورک، میگوید: «این دستاورد میتواند شما را از زمان جلوتر ببرد، بر طرز فکر شما در مورد مشکلات اثر بگذارد و به حل سریعتر آنها کمک کند. در هر حوزهای از زیستشناسی که به مطالعه مشغول باشید، این ابزار میتواند مفید باشد.»
شکل یکی از پروتئینهای مگس میوه که توسط دیپمایند پیشبینی شده است. پایگاه داده جدید شرکت شامل ساختارهای سهبعدی تمام پروتئینهایی است که توسط ژنوم انسان بیان و پروتئینهایی که در ۲۰ موجود زنده دیگر ساخته میشود.
دانش جدید، بهنوعی کلید خود است؛ اگر دانشمندان بتوانند شکل پروتئین را تعیین کنند، میتوانند نحوهی اتصال مولکولهای دیگر را به آن مشخص کنند. این دانش ممکن است مثلاً چگونگی مقاومت باکتریها در برابر آنتیبیوتیکها و نحوهی مقابله با این مقاومت را آشکار کند. باکتریها با بیان پروتئینهای خاصی در برابر آنتیبیوتیکها مقاومت حاصل میکنند؛ اگر دانشمندان بتوانند اشکال این پروتئینها را شناسایی کنند، میتوانند آنتیبیوتیکها یا داروهای جدیدی بسازند که آنها را سرکوب کنند.
در گذشته، تعیین شکل پروتئین به چندین ماه، سال یا حتی دههها آزمایش و خطا نیاز داشت که در آن از اشعه ایکس، میکروسکوپ و ابزارهای آزمایشگاهی دیگر استفاده میشد؛ اما دیپمایند به کمک تکنیکی که آلفافولد (AlphaFold) نام دارد، میتواند این جدول زمانی را به مقدار قابل توجهی کاهش بدهد.
وقتی دکتر مکگیان فهرست هفت آنزیم خود را به دیپمایند فرستاد، به آزمایشگاه گفت شکل دو مورد از آنها را قبلاً مشخص کرده است؛ اما به آنها نگفت کدام دو مورد بودهاند. این روشی برای آزمایش مقدار کارایی سیستم بود. آلفافولد با پیشبینی صحیح هر دو شکل در آزمون موفق شد. آنچه برای دکتر مکگیان قابل توجه بود، این بود که پیشبینیها طی چند روز آماده شد. البته او بعداً متوجه شد که آلفافولد در واقع طی چند ساعت این کار را انجام داده است.
آلفافولد ساختار پروتئینها را با استفاده از شبکه عصبی پیشبینی میکند که سیستم ریاضی است که با تجزیهوتحلیل حجم بالایی از اطلاعات میتواند وظایف را یاد بگیرد (در این مورد، هزاران پروتئین شناختهشده و اشکال فیزیکی آنها) و آن را در مورد ناشناختهها به کار ببرد.
شبکه عصبی همان فناوری است که دستورهای صوتی را که به تلفن هوشمند خود میدهید، شناسایی میکند؛ چهرههای موجود در تصاویری که در فیسبوک ارسال میکنید، شناسایی میکند و در مترجم گوگل یک زبان را به زبان دیگر ترجمه میکند و موارد دیگر؛ اما بسیاری از کارشناسان بر این باورند که آلفافولد یکی از قدرتمندترین کاربردهای این فناوری است.
همانطور که دکتر مکگیان کشف کرد، آلفافولد میتواند به طرز چشمگیری دقیق باشد. بر اساس آزمایشهای مستقلی که در آن پیشبینیهای این فناوری را با ساختارهای شناختهشده پروتئین مقایسه میکند، آلفافولد میتواند شکل پروتئین را با دقتی پیشبینی کند که در حدود ۶۳ درصد از اوقات با پیشبینیهای حاصل از آزمایشهای فیزیکی قدرت رقابت دارد.
بیشتر کارشناسان تصور میکردند فناوری مذکور به این سرعت تا این حد پیشرفت نمیکند. رندی رید، استاد دانشگاه کمبریج، میگوید: «فکر میکردم ۱۰ سال دیگر طول بکشد.»
اما دقت سیستم متغیر است؛ بهطوریکه برخی از پیشبینیها در پایگاه داده دیپمایند، از بقیه سودمندی کمتری دارند. هر پیشبینی در پایگاه داده همراه با یک امتیاز اطمینان میآید که نشان میدهد این عدد احتمالا چقدر دقیق است. پژوهشگران دیپمایند برآورد میکنند که سیستم آنها در حدود ۹۵ درصد از مواقع، پیشبینی خوبی ارائه میدهد.
بنابراین سیستم نمیتواند بهطور کامل جایگزین آزمایشهای فیزیکی شود. این روش در کنار روشهای آزمایشگاهی استفاده میشود تا به دانشمندان کمک کند که تعیین کنند چه آزمایشهایی باید انجام بدهند و زمانی که آزمایشها ناموفق باشند، شکاف را پر میکند.
پروتئینی که توسط باکتری ایکولای بیان میشود. پژوهشگران از هوش مصنوعی برای درک این مسئله استفاده میکنند که چگونه پاتوژنهایی مانند ایکولای و سالمونلا در برابر آنتیبیوتیکها مقاومت حاصل میکنند.
پژوهشگران دانشگاه کلرادو بولدر اخیرا با استفاده از آلفافولد به شناسایی ساختار پروتئینی کمک کردهاند که بیش از یک دهه برای شناسایی آن تلاش میکردند.
توسعهدهندگان دیپمایند با امید ایجاد پیشرفت در تمام حوزههای علوم زیستی تصمیم گرفتند به جای فروش دسترسی، پایگاه داده خود از ساختارهای پروتئینی را در اختیار همه قرار بدهند.
برخی دانشمندان پایگاه داده جدید دیپمایند را به پروژه ژنوم انسان مقایسه کردهاند. این پروژه که در سال ۲۰۰۳ تکمیل شد، نقشهی تمامی ژنهای انسان را ارائه کرد. اکنون دیپمایند نقشهای از تقریبا ۲۰ هزار پروتئین فراهم کرده است که توسط ژنوم انسان بیان میشود. این نقشه به پژوهشگران کمک میکند سازوکار بدن را بهتر درک کنند و متوجه شوند که در صورت بروز مشکل، چگونه میتوان آن را رفع کرد.
پژوهشگران همچنین امیدوار هستند این فناوری پیشرفتهتر شود. آزمایشگاهی در دانشگاه واشینگتن سیستم مشابهی به نام RoseTTAFold ساخته و مانند دیپمایند کد کامپیوتری هدایتکنندهی سیستم خود را به اشتراک گذاشته است. همه میتواند از این فناوری استفاده کنند و هر کسی میتواند برای بهبود آن تلاش کند.
حتی پیش از اینکه دیپمایند بهصورت علنی فناوری و دادههای خود را به اشتراک بگذارد، آلفافولد به پروژههای بسیاری کمک میکرد. پژوهشگران دانشگاه کلرادو در حال استفاده از این فناوری هستند تا متوجه شوند چگونه باکتریهایی مانند ایکولای و سالمونلا در برابر آنتیبیوتیکها مقاوم میشوند و راههایی برای مبارزه با این مقاومت پیدا کنند.
پژوهشگران دانشگاه کالیفرنیا در سانفرانسیسکو از این ابزار استفاده کردهاند تا درک بهتری از ویروس کرونا به دست آورند. ویروس کرونا به کمک ۲۶ پروتئین مختلف بدن را به ویرانی میکشاند. پژوهشگران به کمک آلفافولد توانستهاند اطلاعاتی در مورد یکی از پروتئینهای اصلی به دست آورند و امیدوار هستند این فناوری بتواند به افزایش دانش آنها درزمینهی ۲۵ پروتئین دیگر نیز کمک کند. اگر این پیشرفت آنقدر دیر حاصل شود که تأثیری روی دنیاگیری کنونی نداشته باشد، میتواند در کسب آمادگی در برابر دنیاگیری بعدی کمک کند. کلمنت وربا، یکی از پژوهشگران در دانشگاه کالیفرنیا در سانفرانسیسکو، میگوید: «درک بهتر این پروتئینها به ما کمک میکند تا نهتنها این ویروس را هدف قرار بدهیم بلکه بتوانیم به ویروسهای دیگر نیز حمله کنیم.»
کاربردهای احتمالی فناوری توصیفشده بیشمار است. پس از اینکه هوش مصنوعی دیپمایند شکل هفت پروتئین را به دکتر مکگیان داد که بهطور بالقوه میتواند جهان را از ضایعات پلاستیکی رهایی بخشد، او ۹۳ مورد دیگر را برای آزمایشگاه فرستاد که به گفتهی وی در حال کار روی آن هستند.