گامهای موفقیتآمیز هوش مصنوعی دیپ مایند در پیشبینی مدلسازی پروتئین
هوش مصنوعی دیپمایند گوگل ادعا میکند که به نقطه عطف مهمی در حوزهی پیشبینی مدلسازی پروتئین دست یافته است و میتواند با سیستمی مبتنی بر هوش مصنوعی، ساختارهای پیچیده همانند ساختار سهبعدی پروتئین را تنها براساس توالی ژنتیکی آن پیشبینی کرده و نمایش دهد.
دانستن ساختارهای پروتئینی در تشخیص و درمان بیماریها حائز اهمیت است و میتواند درک دانشمندان را نسبت به بدن انسان بالاتر ببرد. همچنین میتواند بهصورت بالقوه در طراحی ساختار پروتئین و مهندسی زیستی بسیار کمککننده باشد. نزدیک به دو سال است که هوش مصنوعی دیپمایند، سخت در تلاش است تا در زمینهی پیشبینی تاشدگی پروتئین پیشرفتهایی را بهانجام برساند. در پست وبلاگ هوش مصنوعی دیپمایند به این موضوع اشاره شده است:
مدلهای سهبعدی پروتئین که هوش مصنوعی AlphaFold دیپمایند تولید میکند، بسیار دقیقتر از آن است که پیشتر در اختیار دانشمندان قرار داشته و شاهد پیشرفتهای قابلتوجهی در حوزههای چالشبرانگیز زیستشناسی هستیم.
برای پیشبینی مدلسازی مولکول پروتئین، روشهای مختلف علمی از جمله چگونگی تاشدگی پروتئین وجود دارد. تاشدگی پروتئین فرآیندی است که در آن، پلیپپتیدها به ساختار سهبعدی مشخصی پیچیده میشوند. پلی پیتیدها، زنجیرهای از اسیدهای آمینه هستند که در ابتدا ساختار سهبعدی ندارند و براساس ویژگیهای شیمیایی خاص در یک محیط سلولی برهمکنش میکنند و در نهایت ساختار سهبعدی ویژهای را بهنمایش میگذارند. زنجیرهی اسیدهای آمینه، وضعیت این ساختار را مشخص میکند و سازوکار تاشدگی پروتئینها در این فرآیند ناشناخته است.
بههمین دلیل، با توجه به اینکه عوامل مختلفی در سازوکار تاشدگی پروتئین دخیل هستند و تعامل بین آمینواسیدها میتواند ساختار سهبعدی پروتئین را تغییر دهد، مدلسازی ساختار سهبعدی کاری بسیار پیچیده است. بازی پرطرفدار FoldIt، تلاش میکند تا شکلهای مختلف پروتئین را بهنمایش بگذارد. هوش مصنوعی دیپمایند مدعی است که رویکردی را در پیش گرفته که حاصل تحقیقات انجامشده در سالهای قبل است و از دادههای بزرگ برای پیشبینی ساختار پروتئین استفاده میکند و بهصورت مشخص، از روشهای یادگیری عمیق برای دادههای ژنومی استفاده میکند. در پست وبلاگ آمده است:
«خوشبختانه، بهلطف کاهش سریع هزینههای توالیهای ژنتیکی، حوزهی ژنومیک در زمینهی دادهها بسیار غنی است. در نتیجه، رویکردهای یادگیری عمیق برای پیشبینی مشکلات برمبنای دادههای ژنومیک، بهصورت فزایندهای در سالهای اخیر محبوب شده است. دیپمایند برای حل این مشکل، هوش مصنوعی AlphaFold را معرفی کرده که در پروژهی CASP نیز پذیرفته شده است.
مفتخریم که بهعنوان بخشی از اعضای انجمن CASP، پیشرفت بیسابقهای در حوزهی روشهای محاسباتی برای پیشبینی ساختار پروتئین در پیش گرفتهایم و در بین تیمهایی که وارد این حوزه شدهاند، موفق به کسب اولین رتبه شدیم (ما گروه A7D هستیم).
تیم ما بهصورت خاص روی مدلسازی اشکال مختلف پروتئین متمرکز شده است و از قالبهای قبلی پروتئینی که قبلا مورد استفاده قرار گرفتهاند نیز استفاده نمیکند. در زمان پیشبینی خواص فیزیکی ساختار پروتئین، دقت بالایی به ثبت رسید و درنهایت دو روش متمایز برای پیشبینی ساختار کامل پروتئین مورد استفاده قرار گرفت».
دیپمایند معتقد است که در هر دو روش از شبکههای عصبی عمیق آموزشدادهشده برای پیشبینی خواص پروتئین مربوط به توالی ژنتیکی، استفاده شده است. وبلاگ هوش مصنوعی دیپمایند اعلام کرد: «خواصی که هوش مصنوعی دیپمایند میتواند پیشبینی کند عبارتند از: الف) فاصله بین جفت اسید آمینهها و (ب) زاویه بین پیوندهای شیمیایی که این اسید آمینهها را به یکدیگر متصل میکند. طرح توسعهی اولیهی این سیستم، پیشرفتهای قابلتوجهی نسبت به روشهای معمول از خود نشان داده است و توانسته در مورد جفت آمینه اسیدی که در نزدیکی یکدیگر قرار خواهند گرفت پیشبینی کند. ما شبکهی عصبی را برای پیش بینی توزیع فاصلهی بین هر جفت آمینه اسید در پروتئین آموزش دادیم. حاصل این احتمالات، درنهایت بهصورت یک نمره تخمین زده شدند که پیشبینی از ساختار پروتئین را بهصورت دقیق ارائه میدهد. همچنین توانستیم شبکهی عصبی دیگری را بهصورت جداگانه آموزش دهیم که با استفاده از فاصلهها بتواند پیشبینی در مورد چگونگی ساختار نهایی ارائه دهد که به پاسخ صحیح نزدیکتر است. سپس از روشهای جدیدی برای پیشبینی ساختارهای پروتئینی، جستجوی ساختارهای شناختهشده که با پیشبینیهای انجامشده مطابقت دارند، استفاده کردیم.
روش اول برمبنای تکنیکهایی که معمولا در زیست شناسی ساختاری استفاده میشود و بهصورت مکرر جایگزین قطعات ساختاری پروتئین با قطعات جدید پروتئینی میشود، شکل گرفته است. شبکهی عصبی ایجادشده، میتواند قطعات جدید را آموزش بدهد و بهصورت پیوسته در جهت بهبود امتیاز یا نمرهی نهایی ساختار پیشنهادی پروتئین در تلاش است.
روش دوم بهینهسازی امتیازها و نمرات بهصورت شیبدار است. معمولا از روشهای ریاضی برای توسعههای جزئی و کوچکی در سیستمهای مبتنی بر یادگیری ماشین استفاده میکنند. استفاده از این روشها باعث ارائهی ساختار پیشبینیشدهی بسیار دقیقتری میشود. درنهایت این روش به کل زنجیرهی پروتئین نسبت داده میشود و همچنین این روش به قطعاتی که بهصورت جداگانه و قبل از جمعشدن، تا میشوند نیز قابل اعمال است و از پیچیدگیهای مربوط به پیشبینی کم میکند».
هوش مصنوعی دیپمایند، نتایج حاصله را بهعنوان پیشرفت و توسعه در زمینهی پیشبینی ساختار زنجیرهی پروتئین مطرح کرده که این پیشرفت حاصل استفاده از روشهای محاسباتی و تاثیر هوش مصنوعی در این اکتشاف علمی است.
باوجودی که هوش مصنوعی دیپمایند تاکید میکند هنوز روشهای یادگیری عمیق باید مسیری را طی کنند تا بتوانند تاثیر قابلتوجهی در حوزهی درمان بیماریها و مدیریت محیطزیست و موارد بیشتر داشته باشند؛ ولی میدانیم که پتانسیل بسیار بالایی در این حوزه وجود دارد. با حضور تیم اختصاصی و متمرکز بر چگونگی یادگیری ماشین، میتوانیم در این مسیر گامهای بلندی برداریم و منتظر راههای جدیدی هستیم که میتواند فناوری را تغییر دهد.
نظرات