چگونه می‌توان داده‌ها را برای هزار سال ذخیره کرد؟

پنج‌شنبه ۲۸ مهر ۱۴۰۱ - ۱۳:۳۰

مطالعه 18 دقیقه

بیشتر سیستم‌های ذخیره‌سازی داده‌ موجود درنهایت از کار می‌افتند. اما جایگزین‌هایی وجود دارد که ممکن است بتوانند داده‌ها را به مدت طولانی حفظ کنند.

تبلیغات

دینا زلینسکی، دانشمند ژنومیک انسان در مؤسسه ملی بهداشت و تحقیقات پزشکی فرانسه در خانه‌اش در پاریس، ظرف شیشه‌ای کوچکی را رو به دوربین لپ‌تاپ خود نگه می‌دارد تا من (جوسلین تیمپرلی، روزنامه‌نگار بی‌بی‌سی) در تماس ویدئویی آن را ببینم. تشخیص آن سخت است، اما او می‌گوید که باید بتوانم لایه روشن و تقریباً شفافی را در ته ظرف ببینم که همان DNA است.

اما این DNA خاص است و حاوی کد ژنوم انسان نیست و از حیوان یا ویروسی نیز نیامده است. درعوض، این DNA نمایش دیجیتالی از یک موزه را در خود ذخیره دارد. زلینسکی می‌گوید: «به‌راحتی ده‌ها سال و شاید صدها سال دوام خواهد آورد.»

پژوهش دراین‌باره که چگونه می‌توانیم داده‌های دیجیتال را درون رشته‌های DNA ذخیره کنیم، در دهه گذشته و در پی توالی‌یابی ژنوم انسان، سنتز DNA و توسعه ژن‌درمانی به‌شدت افزایش پیدا کرده است. دانشمندان فیلم‌ها، کتاب‌ها و سیستم‌های عامل کامپیوتر را درون DNA رمزگذاری کرده‌اند. نتفلیکس حتی از آن برای ذخیره‌سازی یکی از قسمت‌های مجموعه‌ی «بیوهکرها» استفاده کرده است.

اطلاعات ذخیره‌شده در DNA مشخص می‌کند که موجود حاصل از آن اطلاعات چه باشد. اما بسیاری از کارشناسان می‌گویند DNA شکل فشرده، بادوام و ماندگاری از ذخیره‌سازی را فراهم می‌کند که می‌تواند جایگزین بسیاری از اشکال دیجیتالی نامطمئنی شود که عمر کوتاهی دارند و برای ذخیره‌سازی به انرژی بسیار زیادی نیاز دارند.

در همین حین، برخی از پژوهشگران درحال بررسی راه‌های دیگری هستند که می‌توانیم داده‌ها را عملاً برای همیشه در آن‌ها ذخیره کنیم، مانند حک کردن اطلاعات روی مهره‌های شیشه‌ای بسیار بادوام که از نقاشی‌های غار الهام گرفته شده است. اما این داده‌ها واقعاً چقدر می‌توانند دوام بیاورند و آیا واقعاً می‌توانیم برای ذخیره حجم عظیمی از داده‌ها که توسط انسان تولید می‌شود، بر آن‌ها تکیه کنیم؟

همان‌طور که به سمت دنیای دیجیتالی‌تر پیش می‌رویم، وابستگی ما به داده‌ها به‌شدت افزایش پیدا می‌کند. فیلم‌ها، عکس‌ها، صفحات وب، اسناد تجاری، سوابق امنیتی حیاتی و همه چیزهایی که استفاده می‌کنیم، دیجیتالی شده‌اند و ما هر روز بیشتر از این شکل از داده‌ها استفاده می‌کنیم.

بیشتر مجموعه داده‌های که تولید کرده‌ایم، به شکل یک و صفر روی نوارهای مغناطیسی ذخیره می‌شوند اما این راه‌حل ایده‌آلی نیست. یکی از مشکلات بزرگ، مغناطیس‌کاهی است. آهنرباهای دائمی به‌تدریج میدان مغناطیسی خود را از دست می‌دهند، بنابراین، برای اطمینان از حفظ داده‌ها مهم است که هر چند سال یک بار هارد دیسک‌ها بازنویسی شوند. زلینسکی می‌گوید: «به‌طور متوسط شاید حدود ۱۰ تا ۲۰ سال دوام داشته باشد و اگر خوش‌شانس باشید و شرایط عالی باشد ممکن است تا ۵۰ سال بماند.»

ارسال خودروی تسلا رودستر به فضا / Tesla roadster

در سال ۲۰۱۸، اسپیس ایکس خودروی تسلا رودستر را به همراه نسخه حکاکی‌شده مجموعه کتاب بنیاد اثر ایزاک آسیموف به فضا فرستاد.

ذخیره‌سازی داده‌ها همچنین به مراکز داده عظیمی نیاز دارد که از مقادیر زیادی انرژی برای خنک نگه داشتن تجهیزات استفاده می‌کنند که در دنیایی که با بحران انرژی رو‌به‌رو است، ایده‌آل نیست. این مشکل آن‌قدر مهم به‌نظر می‌رسد که در سال ۲۰۱۹ برنامه ذخیره‌سازی اطلاعات مولکولی ایالات متحده (MIST) با هدف پیدا کردن جایگزینی برای تأسیسات کنونی ذخیره‌سازی داده راه‌اندازی شد. زلینسکی می‌گوید: «ازنظر سخت‌افزار واقعاً داریم به پایان خط می‌رسیم. فکر می‌کنم که صنعت واقعاً توانایی تولید هارد دیسک‌ها و سرورهای کافی برای ذخیره‌سازی تمام این اطلاعات را ندارد.»

اما آیا واقعاً نیاز داریم که تمام این داده‌ها را نگه داریم و آن‌ها را برای مدت طولانی حفظ کنیم؟

افراد به دلایل مختلفی می‌خواهند داده‌ها را برای مدت طولانی ذخیره کنند. یکی از دلایل آن علم است. پژوهشگران درحال تولید حجم بی‌سابقه‌ای از داده‌ها هستند و هرچه داده‌های بیشتری داشته باشند، بهتر است.

مقاله‌های مرتبط:

چرا سازندگان هارد دیسک روی ذخیره‌سازی داده‌ها در DNA سرمایه‌گذاری می‌کنند؟

با این وبسایت موقعیت خودروی تسلا رودستر ایلان ماسک را در فضا دنبال کنید

نوستالژی؛ فلاپی دیسک چیست و آیا هنوز کاربرد دارد؟

لچسار یونکوف، دانشمند کامپیوتر که در آزمایشگاه ملی لس آلاموس روی ذخیره‌سازی DNA کار می‌کند، می‌گوید، برای مثال، تلسکوپ‌های رادیویی و شتاب‌دهنده‌های ذرات مانند برخورددهنده هادرونی بزرگ (LHC) در سازمان تحقیقات هسته‌ای اروپا (CERN) در مرز فرانسه و سوئیس داده‌های فراوانی را تولید می‌کنند و دانشمندان می‌خواهند همه آن‌ها را حفظ کنند. فقط LHC هر سال ۹۰ پتابایت ( ۹۰ میلیون گیگابایت) داده تولید می‌کند.

مارک بیث، استاد مهندسی زیستی در مؤسسه فناوری ماساچوست یکی از بنیان‌گذاران استارتاپ Cache DNA است که با هدف ایجاد دسترسی گسترده و مفید به مولکول‌های زیستی تأسیس شد. بیث می‌گوید تهدیدهای جهانی که بشریت با آن رو‌به‌رو است، ما را بر آن می‌دارد که هم اطلاعات ساخت بشر مانند هنر و علم را حفظ کنیم و هم DNA همه موجودات روی زمین را حفظ کنیم. او می‌گوید: «اگر قرار باشد حیات اینجا بازآفرینی شود یا به سیاره دیگر برده یا از آنجا آورده شود، با ذخیره‌سازی داده‌ها، سوابقی از آن‌چه انجام دادیم و آنچه داشتیم، وجود خواهد داشت.»

بسیاری از پژوهشگرانی که روی ذخیره‌سازی اطلاعات در DNA کار می‌کنند، بر این باورند که محیط ذخیره‌سازی عالی برای برای ذخیره‌سازی گسترده و پایدار پیدا کرده‌اند.

ما معمولاً DNA را به‌عنوان راهی برای ذخیره‌سازی اطلاعات ژنومیک می‌بینیم، اما بسیاری از پژوهشگران درمورد امکان ذخیره حجم عظیمی از داده‌های دیجیتالی که مراکز داده سراسر جهان را پر کرده‌اند، هیجان‌زده هستند. بیث می‌گوید DNA در این‌جا یک انتخاب منطقی است: «هزاران سال است که طبیعت از DNA برای ذخیره‌سازی اطلاعات به شکل ژنوم استفاده می‌کند. دی‌ان‌ای میلیاردها سال است که وجود دارد و چیزی است می‌توانید روی آن حساب کنید. تا زمانی که DNA محیط ذخیره‌سازی اطلاعات اساسی گونه‌ای مانند انسان باشد، چیزی خواهد بود که می‌دانیم با آن چه‌کار کنیم.»

شتاب‌دهنده‌های ذرات جهان هر سال صدها پتابایت داده تولید می‌کنند

زلینسکی می‌گوید، این واقعیت را که DNA طی ۳/۷ میلیارد سال گذشته بهینه شده است، با عصر اطلاعات مقایسه کنید که در دهه‌ی ۱۹۵۰ آغاز شد. او می‌گوید: «درزمینه فناوری‌های ساخت بشر خیلی پیشرفت کرده‌ایم اما فناوری‌های ما ازنظر کارآیی از DNA بهتر نیستند. وقتی زندگی ما به‌عنوان یک سلول شروع می‌شود، تمام دستورالعمل‌ها برای هدایت تک‌تک سلول‌ها در آن وجود دارد تا زمانی که به حدود ۳۰ تریلیون سلولی می‌رسیم که بدن انسان را تشکیل می‌دهد.»

زلینسکی می‌گوید علاوه‌بر‌این، این واقعیت که می‌توانیم قطعات DNA را از حیوانات چند هزار ساله مانند ماموت‌های پشمالو بازیابی کنیم که اطلاعات سودمندی را درمورد ژنوم آن‌ها ارائه می‌دهند، نشان می‌دهد که DNA بسیار بادوام است.

نیمه‌عمر DNA (مدت زمانی که طول می‌کشد تا نصف آن تخریب شود) در فسیلی که به خوبی حفظ شده است، حدود ۵۰۰ سال است، به این معنا که پس از حدود ۱/۵ میلیون سال DNA دیگر قابل خواندن نخواهد بود.

با‌این‌حال، DNA بسیار شکننده است و شرایطی که منجر به تشکیل فسیل می‌شود، فوق‌العاده نادر است. رطوبت، اسید و تشعشات به دی‌ان‌ای آسیب می‌رسانند. اولگیکا میلنکوویچ، استاد مهندسی برق و کامپیوتر در دانشگاه ایلینوی در اربانا شمپین می‌گوید: «راه‌های بسیار زیادی برای تخریب DNA وجود دارد. اما اگر در شرایط سرد و خشک نگه‌داری شود، صدها سال می‌ماند.».

از طرف دیگر، DNA را می‌توان با قرار دادن درون مواد دیگری مانند دانه‌های شیشه‌ای محافظت کرد که تقلیدی از نحوه محافظت شدن مواد ژنتیکی درون فسیل‌های باستانی است. رابرات گراس، پژوهشگر مؤسسه فناوری فدرال زوریخ در سوئیس و تیمش نشان داده‌اند که این دانه‌ها از DNA دربرابر مواد شیمیایی و گرما محافظت می‌کنند.

حفاظت بیشتر می‌تواند از قرار دادن آن در مکان امن ازنظر فیزیکی حاصل شود. به‌گفته‌ی میلنکوویچ، ذخیره کردن داده‌های دیجیتالی که برای بشریت حیاتی است در DNA محصورشده در طاقی یخی می‌تواند به این معنا باشد که این اطلاعات می‌تواند تقریباً تا ابد بماند.

یکی دیگر از مزیت‌های بزرگ DNA این است که تراکم اطلاعات در آن بالا است تا حدی که هیچ یک از دستگاه‌های ساخت بشر به پای آن نمی‌رسد. به‌گفته‌ی یونکوف، حدود ۳۳ زتابایت داده‌ای که طبق تخمین‌ها، انسان تا سال ۲۰۲۵ تولید خواهد کرد (۳/۳ و ۲۲ صفر جلوی آن) می‌تواند با ذخیره‌سازی درون DNA به اندازه یک توپ پینگ‌پنگ فشرده شود. او بر این باور است که با دستیابی به توانایی ذخیره کردن این مقدار اطلاعات در DNA ممکن است فقط چند دهه فاصله داشته باشیم.

قبل از اینکه مارپیچ مضاعف DNA در سال ۱۹۵۳ کشف شود، بسیاری از دانشمندان معتقد بودند که ساختار آن برای ذخیره اطلاعات بیش از حد ساده است، اما آن‌ها در اشتباه بودند.

علاوه‌بر‌این، برخلاف دیگر محیط‌های ذخیره‌سازی اطلاعات ساخت بشر، بعید است که ذخیره‌سازی اطلاعات درون DNA هرگز منسوخ شود. میلنکوویچ می‌پرسد: «کدام‌یک از ما هنوز از فلاپی‌دیسک استفاده می‌کنیم؟» درمورد DNA، همیشه باید بتوانیم آن را بخوانیم. زلینسکی می‌گوید: «درمورد هر فناوری ساخت بشر به دستگاه جدیدی برای خواندن آن نیاز دارید. اگر DNA منسوخ شود، در آن شرایط، مسائل دیگری برای نگرانی خواهیم داشت.»

مزیت‌های دیگری نیز برای ذخیره‌سازی اطلاعات درون DNA وجود دارد. میلنکوویچ خاطرنشان می‌کند توالی‌های DNA قبلا با موفقیت در علوم پزشکی مانند ژن‌درمانی و زیست‌شناسی مصنوعی استفاده شده است و این امر با پیشرفت تحقیقات ادامه پیدا می‌کند. برای ذخیره‌سازی آن همچین به انرژی نیازی نیست.

البته چالش‌های بزرگی هم وجود دارد. همان‌طور که در مقاله‌ای که سال ۲۰۱۸ منتشر شد، آمده است، درحالی‌که DNA پتانسیل عظیمی به‌عنوان ابزار ذخیره‌سازی داده در آینده دارد، تنگناهای متعددی مانند هزینه‌های بسیار زیاد، مکانیسم‌های بسیار کند نوشتن و خواندن و آسیب‌پذیری نسبت‌به جهش‌ها یا خطاها وجود دارد که نیاز است برطرف شود.

فرایند تبدیل داده‌های دیجیتال به DNA اساسا شامل تبدیل آن به الفبای DNA است. دی‌ان‌ای از چهار مولکول معروف به نوکلئوتید یا باز تشکیل شده است: آدنین (A)، سیتوزین (C)، گوانین (G) و تیمین (T) که با ترتیب‌های متفاوتی در رشته‌های طولانی به هم متصل شده‌اند.

رایج‌ترین روش برای تبدیل اطلاعات دیجیتال به کدهای DNA نیازمند تبدیل صفرها و یک‌های کد دیجیتال به این چهار حرف و سپس سنتز DNA مطابق با آن است. میلنکوویچ می‌گوید: «می‌توانید از A برای نشان دادن برای مثال ۰۰، از T برای نشان دادن ۰۱ از G برای نشان دادن ۱۰ و از C برای نشان دادن ۱۱ استفاده کنید. سپس می‌توانید هر محتوای دیجیتالی را که به صورت کلاسیک روی دیسک یا نوار یا فلش وجود دارد، به این الفبای چهار حرفی تبدیل کنید.»

سنتز DNA روشی بود که توسط دو مقاله برجسته‌ی منتشرشده در سال‌های ۲۰۱۲ و ۲۰۱۳ استفاده شد که هر کدام حدود ۷۰۰ کیلوبایت داده را در DNA ذخیره کردند (رکورد قبلی کمتر از یک کیلوبایت بود).

در مقاله‌ای در سال ۲۰۱۷، زلینسکی (که در آن زمان پژوهشگری در مرکز ژنوم نیویورک بود) و همکارانش یک مقاله علمی، یک فیلم یک دقیقه‌ای، سیستم عامل کامپیوتر، ویروس کامپیوتر و کارت هدیه آمازون (درمجموع حدود دو مگابایت) را با استفاده از این روش روی DNA ذخیره کردند.

البته مانع بزرگ برای ذخیره‌سازی داده‌های زیاد روی DNA هزینه است که بسیار بیشتر از هزینه ذخیره‌سازی داده‌ها روی سرورها یا هارد دیسک‌ها است. ذخیره‌سازی آن پنج مورد دیجیتال برای زلینسکی ۷۵۰۰ دلار هزینه داشت.

زلینسکی می‌گوید هزینه ذخیره‌سازی روی DNA متغیر است، زیرا به روش سنتز و طرح رمزگذاری و نحوه رمزگشایی آن بستگی دارد. او می‌گوید، تخمین معقول در حدود چند هزار دلار به ازای هر مگابایت داده، هم برای رمزگذاری و هم رمزگشایی با استفاده از توالی‌یابی است.

سخنرانی گتیسبورگ آبراهام لینکلن، رئیس‌جمهور ایالات متحده، روی توالی DNA تغییریافته باکتری ای‌کولای ذخیره شده است.

برای مثال، تبدیل این مقاله و تصاویر آن به اطلاعات ذخیره‌شده روی DNA به معنای فشرده‌سازی داده‌ها از حدود ۲۰ مگابایت به حدود ۵۰۰ کیلوبایت، به کارگیری طرح رمزگذاری، سپس ارسال آن برای آزمایشگاه به منظور سنتز رشته با هزینه‌ای در حدود هزار دلار است.

آزمایشگاه با استفاده از روشی که هر بار یک نوکلئوتید را به هر رشته DNA اضافه می‌کند، فرایند پرزحمت ساخت آن را تکمیل می‌کند. زلینسکی می‌گوید: «بزرگ‌ترین مانع سنتز DNA است و کاهش هزینه بزرگ‌ترین تمرکز پژوهشگران است.»

اگرچه نیازی نیست که رشته‌های حاصل کامل باشند. اگر از آن برای ذخیره‌سازی داده‌ها استفاده می‌کنید و نه رویه‌های پزشکی (که سنتز DNA در ابتدا برای آن‌ها توسعه پیدا کرد)، ممکن است نرخ بالاتری از خطا را بتوان تحمل کرد. بنابراین، فضا برای ایجاد روش‌های سریع‌تر و با دقت کم‌تر سنتز وجود دارد. زلینسکی می‌گوید: «می‌توانید خطاهای موجود در داده‌ها را مدیریت کنید و همچنان فایل‌های خود را بازیابی کنید. بنابراین می‌توانیم سنتز غیردقیق‌تری داشته باشیم.»

بیث می‌گوید برای اینکه بتواند با محیط‌های دیجتال رایج رقابت کند، هزینه ذخیره‌سازی اطلاعات روی DNA باید حدود یک میلیون برابر کم‌تر شود. این راه بسیار طولانی است، اما دانشمندان درحال کار روی روش‌هایی برای افزایش تعداد مولکول‌های DNA هستند که می‌تواند به‌طور هم‌زمان نوشته شود. بیث می‌افزاید، اگر به صنعت الکترونیک نگاه کنید، آن‌ها شاهد کاهش هزینه‌ها بوده‌اند. هزینه سنتز دی‌ان‌ای نیز نسبت‌به قبل به میزان قابل‌توجهی کاهش پیدا کرده است.

گزینه دیگری که نیاز به سنتز ندارد، ذخیره‌سازی داده‌ها در DNA طبیعی است که ویرایش شده است.

در سال ۲۰۲۰ گروه میلنکوویچ د‌ی‌ان‌ای باکتری ای‌کولای را برای ذخیره‌سازی سخنرانی گتیسبورگ آبراهام لینکلن، رئیس‌جمهور آمریکا و تصویری از یادبود لینکلن، با ایجاد سیستم کارت پانچ برای ایجاد شکاف‌هایی در توالی ژنتیکی باکتری ویرایش کردند (درواقع با ایجاد شکاف‌هایی کوچکی در نوکلئوتیدها با استفاده از سیستم‌های ویرایش ژنی مانند کریسپر و آنزیم‌های برش‌دهنده دیگر). این رویکرد درنهایت می‌تواند ارزان‌تر از ساخت مولکول‌های DNA کاملاً جدید باشد. میلنکوویچ می‌گوید: «این مدل کاملاً متفاوتی است. شما اطلاعات را در محتوای توالی و به شکل ترکیبی از ATGC ذخیره نمی‌کنید، بلکه اطلاعات را به شکل تغییرات ساختاری در ماپیچ مضاعف ذخیره می‌کنید.»

میلنکوویچ می‌گوید باکتری اصلی به نقطه مرجع کد تبدیل می‌شود و به سنتز نیازی نیست که به این معنا است که فرایند باید ارزان‌تر باشد و محصولات جانبی سمی مرتبط با سنتز DNA تولید نمی‌شوند. اگرچه هزینه‌ای که در این‌جا پرداخت می‌شود، کاهش تراکم داده‌هایی است که می‌توان در رشته خاصی از دی‌ان‌ای ذخیره کرد: «کاهش تقریباً ۵۰ برابری در تراکم را نسبت‌به روش سنتز دی‌ان‌ای تخمین زدیم.»

دانشمندان می‌دانند که دی‌ان‌ای می‌تواند داده‌ها را برای هزاران سال ذخیره کند، زیرا قبلا ژنوم بسیاری از حیوانات منقرض‌شده را رمزگشایی کرده‌اند.

یکی دیگر از روش‌های تجربی برای ذخیره‌سازی داده‌ها در DNA که در سال ۲۰۱۷ توسط دانشمندان هاروارد گزارش شد، وارد کردن قطعاتی از نوکلئوتیدها به رشته DNA موجود در سلول زنده‌ای است که قطعات DNA را به‌عنوان نوعی مکانیسم ایمنی در خود ادغام می‌کند. این تیم کلیپ فیلم سال ۱۸۷۸ ادوارد مایبریج از اسب درحال چهار نعل کردن را درون یک باکتری قرار دادند. میلنکوویچ می‌گوید: «این اثر در یک موجود زنده باقی می‌ماند. تا زمانی که آن ارگانیسم یا فرزندانش وجود داشته باشند، اطلاعات ذخیره باقی می‌ماند، اگرچه ممکن است در طول زمان جهش پیدا کند و اطلاعات تغییر پیدا کند.»

یونکوف می‌گوید ازآن‌جا که می‌توانیم داده‌ها را از فسیل‌ها استخراج کنیم، تقریباً مطمئن هستیم که اطلاعات ذخیره‌شده در DNA می‌تواند دوام زیادی داشته باشد. بنابراین، سؤال جالب این نیست که محیط ذخیره‌سازی یعنی مولکول‌های DNA تا چه مدت دوام می‌آورند، بلکه این است که آیا می‌توانیم هزار سال دیگر آن داده‌ها را بخوانیم.

سازمان یونکوف بخشی از گروهی به نام اتحادیه ذخیره‌سازی داده‌ها درون دی‌ان‌ای است که به‌دنبال کشف این مسئله است چگونه می‌توانیم اطمینان حاصل کنیم که می‌توانیم داده‌ها را در قرن‌های آینده رمزگشایی کنیم. یکی از کارگروه‌های آن که گروه روزتا استون نام دارد، درحال بررسی نحوه ایجاد دستورالعملی جهانی برای نحوه خواندن آرشیو ذخیره دی‌ان‌ای است.

امروزه خواندن دی‌ان‌ای با چالش‌های متعددی همراه است. ابتدا باید آن را توالی‌یابی کنید. این کار شامل استفاده از تکنیک مولکولی متداولی به نام پی‌سی‌آر برای ساخت تریلیون‌ها نسخه از رشته دی‌ان‌ای می‌شود که می‌خواهید رمزگشایی کنید. متأسفانه این فرایند می‌تواند با خطاهایی همراه باشد. زلینسکی می‌گوید: «بسیاری از این خطاها را به‌راحتی می‌توان هنگام رمزگشایی وقتی دی‌ان‌ای را به حالت داده برمی‌گردانید، کنترل کنید.»

بعد خود توالی می‌آید و اینجا هم مشکلی وجود دارد. درحال‌حاضر توالی‌یابی در دستگاه‌های رومیزی انجام می‌شود که اجرای آن‌ها چند ساعت طول می‌کشد. بنابراین، این شکل از ذخیره‌سازی داده‌ها سیستمی نیست که به سرعت به آن دسترسی داشته باشید.

یکی از مواردی که این زمان انتظار را بهبود می‌دهد، «دسترسی تصادفی» است، یعنی توانایی بررسی داده‌ها برای بازیابی آنچه به‌دنبال آن هستید، به‌طوری‌که نیازی نباشد کل رشته را توالی‌یابی کنید. این مورد با اضافه کردن بارکد به انتهای رشته‌های دی‌ان‌ای نشان داده شده است.

اگرچه به‌گفته‌ی یونکوف، مولکول‌های DNA که درحال‌حاضر تولید می‌شوند، نسبتاً کوتاه هستند (۱۵۰ تا ۲۰۰ جفت باز). بنابراین، استفاده از بخشی از این فضا برای شناسایی رشته دی‌ان‌ای ازطریق بارکد فضای کمتری برای نوشتن داده‌هایی که می‌خواهید ذخیره کنید، باقی می‌گذارد: «این مشکلی بسیار جدی است. اما وقتی فناوری بهتر شود و بتوانیم مولکول‌های بسیار طولانی با هزاران یا ده‌ها هزار جفت باز را بنویسم، مشکل کم‌کم ناپدید می‌شود.»

این نگرانی وجود دارد که روزی دی‌ان‌ای سنترشده برای گمراه کردن تحقیقات پزشکی قانونی مورداستفاده قرار گیرد.

در روش دیگری برای بهبود دسترسی تصادفی، تیم بیث رشته‌های DNA را در مهره‌های سیلیسی قرار داد که با استفاده از رشته‌های کوتاهی از نوکلئوتیدها روی سطح مهره برچسب‌گذاری شده بودند. بیث می‌گوید همان‌طور که برای شناسایی محصولات در یک سوپرمارکت بارکد آن‌ها را می‌خوانید، ما بارکدهایی از جنس اسیدهای نوکلئیک را روی این کپسول‌های کوچک دی‌ان‌ای قرار می‌دهیم تا بتوانیم آن‌ها را شناسایی کنیم و بدانیم حاوی چه اطلاعاتی هستند.

هنوز مشخص نیست که چگونه می‌توانیم اطلاعات ذخیره‌شده درون DNA را وارد کامپیوترهای درحال کار کنیم. تیم بیث با ایجاد سیستم فایل‌بندی برای دی‌ان‌ای آزمایش‌هایی انجام داده است. بیث می‌گوید: «این کار شبیه تبدیل حالت مایع یا جامد اطلاعات دی‌ان‌ای به چیزی شبیه هارد درایو کامپیوتر است که در آن این توانایی را داشته باشید که آن را مانند موتور جستجویی مانند گوگل مورد جستجو قرار دهید.» حتی مایکروسافت درحال بررسی نحوه تلفیق مولکول‌های زیستی در طراحی کامپیوتر است.

با‌این‌حال، سنتز گسترده دی‌ان‌ای با خطراتی همراه خواهد بود. افرادی ممکن است سعی کنند از آن برای ذخیره‌سازی اطلاعاتی به جز داده‌ها استفاده کنند. زلینسکی می‌گوید در تئوری، مردم می‌توانند ویروس‌ها یا باکتری‌ها را سنتز کنند یا حتی دی‌ان‌ای یک فرد را تولید کرده و آن را در صحنه جرم قرار دهند. او می‌گوید: «در بسیاری از خطوطِ تولید توالی‌های ژنتیکی بازسنجی‌هایی وجود دارد که داده‌های تولیدشده را با ژنوم‌های شناخته‌شده مقایسه می‌کنند تا مطمئن شوند که توالی واقعی و مضری مانند توالی یک عامل بیماری‌زا وجود ندارد.»

بیث موافق است که خطرات و مسائل زیادی در ارتباط با حریم خصوصی وجود دارد. او خاطرنشان می‌کند که بسیاری از شرکت‌ها به‌دنبال تهیه فهرستی از دی‌ان‌ای تمام افراد روی زمین هستند. برخی دیگر اشاره کرده‌اند که چقدر ترسناک است که تصور کنیم که کسی بتواند توالی دی‌ان‌ای میلیاردها انسان را درون سیستم ذخیره‌سازی کوچکی نگه‌داری کند. بیث می‌گوید: «باید فناوری‌هایی را دراین‌زمینه بسازیم، زیرا اگر این کار را انجام ندهیم، نمی‌توانیم این خطرات را کاهش داده یا آن‌ها را درک کنیم.»

با توجه به این مسئله، ارزش آن را دارد که درباره جایگزین‌های ذخیره‌سازی داده‌ها درون دی‌ان‌ای فکر کنیم. پیتر کازنسکی، استاد الکترونیک نوری در دانشگاه ساوت‌همپتون نوعی فناوری ذخیره‌سازی نوری را توسعه داده است که به‌عقیده‌ی او رقیب شایسته‌ای محسوب می‌شود که می‌تواند میلیون‌ها یا حتی میلیاردها سال دوام بیاورد.

این تیم با نوشتن لیزری فمتوثانیه‌ای (یک میلیونیم یک میلیاردم ثانیه) کار می‌کنند و با استفاده از لیزری شبیه لیزر مورد استفاده در جراحی چشم، اطلاعات را روی دیسک‌های شیشه‌ای سیلیسی بادوام حک می‌کنند. پالس‌های لیزری کوتاه و شدید به روش خاصی متمرکز می‌شوند تا انفجار ریزی را ایجاد کنند که باعث ایجاد حفره‌ی ریزی درون شیشه می‌شود. کازنسکی می‌گوید: «در این شرایط نانوساختارهای بسیار ریزی می‌تواند تشکیل شود و ما از این ساختارها برای رمزگذاری اطلاعات استفاده می‌کنیم.»

کازنسکی می‌گوید این فرایند شبیه نحوه سوزاندن (burn) سی‌دی‌ها و دی‌وی‌دی‌ها با استفاده از پلیمرهای نور لیزری یا رنگ به منظور ثبت اطلاعات است، اما در این‌جا ساختارها بسیار ریز و پایدار هستند و در دمای تا حداقل هزار درجه سانتیگراد پایدار بوده و توسط تشعشات آسیب نمی‌بینند. او می‌گوید: «یکی از مزیت‌های روش ذخیره‌سازی ما ماندگاری آن است که می‌تواند تقریباً تا ابد باقی بماند.»

این فناوری اطلاعات را در پنج بُعد تولید می‌کند: علاوه بر سه بعد عادی که توسط حفره ایجاد می‌شود، جهت و شکل حفره را نیز می‌توان کنترل کرد که امکان ذخیره‌سازی متراکم‌تر داده‌ها را فراهم می‌کند. این تراکم هرگز نمی‌تواند به تراکم دی‌ان‌ای برسد، اما با افزایش لایه‌ها در حکاکی به آرامی افزایش پیدا می‌کند. تاکنون اسنادی ازجمله اعلامیه جهانی حقوق بشر، منشور کبیر انگلیس، کتاب مقدس شاه جیمز و مجموعه راهنمای مسافر مجانی کهکشان با استفاده از این فناوری ذخیره شده‌اند.

دی‌ان‌ای می‌تواند حجم بالایی از داده‌ها را در یک منطقه میکروسکوپی ذخیره کند.

در سال ۲۰۱۸، ایلان ماسک حکاکی مجموعه علمی‌تخیلی بنیاد اثر آیزاک آسیموف را با موشک فالکون هِوی به فضا فرستاد، درحالی‌که مایکروسافت فیلم سوپرمن ۱۹۷۸ را درون یک شیشه ذخیره کرده است. هنرمند میکا تاجیما حتی داده‌های عواطف انسانی را با استفاده از این روش ذخیره کرده است. او تمام توییت‌های ارسال‌شده در ژاپن در سال ۲۰۲۰ را جمع‌آوری و ذخیره کرد. کازنسکی می‌گوید: «از فرایندی مشابه چیزی که مردم باستان استفاده می‌کردند، استفاده می‌کنیم. آن‌ها به کمک ابزار روی سنگ‌ها علامت‌هایی حک می‌کردند.»

مشابه با روش ذخیره‌سازی داده‌ها در DNA، یکی از مشکلات اصلی ذخیره‌سازی داده‌ها به این روش سرعت نوشتن است. کازنسکی می‌گوید تیم او اکنون می‌تواند با سرعت ۵۰۰ کیلوبایت بر ثانیه بنویسد درحالی‌که هدف آزمایش اولیه که یک دهه پیش انجام شد، حداکثر ۰/۱ کیلوبایت بر ثانیه بود. او می‌گوید: «برای اینکه کاربردی باشد، نیاز است که سرعت شما حداقل هزار کیلوبایت در ثانیه باشد.» مانع دیگر خواندن داده‌ها است که درحال‌حاضر باید به شکل دستی و به کمک میکروسکوپ نوری انجام شود. او می‌گوید باید دستگاهی ساخته شود که روی نمونه حرکت کند و اطلاعات حک‌شده روی آن را بخواند.

دستگاه کنونی مورد استفاده برای حکاکی یک اتاق را پر می‌کند و از لیزر ۱۱۲ هزار دلاری استفاده می‌کند، اگرچه کازنسکی معتقد است که اندازه و هزینه آن می‌تواند کاهش پیدا کند.

درحالی‌که DNA قرار گرفته در حفاظ شیشه‌ای، دربرابر دما و تشعش مقاوم است، محصور کردن خود شیشه در ماده‌ای قوی ممکن است ایده خوبی برای کسی باشد که می‌خواهد از ماندگاری آن اطمینان حاصل کند، زیرا شیشه به‌راحتی با سنگ شکسته می‌شود. زلینسکی می‌گوید: «فکر می‌کنم که روش حکاکی نسبت‌به شرایط محیطی حساسیت کمتری دارد. درحالی‌که این روش به اندازه دی‌ان‌ای متراکم نیست، همچنان راه بسیار کارآمدی برای ذخیره‌سازی داده‌های حیاتی است و مطمئناً می‌توانید خیلی کمتر درمورد آن نگران باشید. هر دستگاهِ ذخیره‌سازی فرصت‌ها، مزیت‌ها و معایب خود را دارد و فکر می‌کنم که دی‌ان‌ای می‌تواند یکی از روش‌های مکمل باشد.»

پژوهشگران دیگر گزینه‌های مولکولی غیر دی‌ان‌ای را برای رمزگذاری داده‌ها دنبال می‌کنند، مانند روش‌هایی که از زنجیره‌هایی از سایر مولکول‌های مصنوعی استفاده می‌کنند که ساخت آن‌ها راحت‌تر و ارزان‌تر است. برای مثال، کد می‌تواند ازطریق کنترل کردن جرم مولکول‌ها تولید شود و جرم‌های متفاوت نشان‌دهنده ترکیب‌های مختلف صفرها و یک‌ها باشد.

درحال‌حاضر این توانایی را داریم که داده‌های دیجیتال را در DNA رمزگذاری کنیم و آن را محصور کنیم و برای صدها یا هزاران سال از آن محافظت کنیم. مسئله مهمی که در این‌جا وجود دارد این است که کدام داده‌ها را برای این کار انتخاب کنیم یا چگونه بر تنگنای سنتز دی‌ان‌ای غلبه کنیم تا بتوانیم حجم عظیم‌تری از داده‌ها را ذخیره کنیم. یونکوف می‌گوید: «درمورد استفاده از DNA برای ذخیره‌سازی داده‌ها هیجان‌زده‌ام، اما فکر می‌کنم ۲۰ سال دیگر نیاز داریم تا به آنجا برسیم.» اگرچه او خاطرنشان می‌کند که برخی شرکت‌ها بر این باورند که طی پنج سال آینده به محصول موفقیت‌آمیزی دست پیدا می‌کنند.

زلینسکی معتقد است که انسان‌ها طی پنج تا ده سال آینده استفاده از DNA را برای ذخیره‌سازی داده‌های سردی مانند سوابق مالی یا داده‌های تاریخی که لازم نیست به‌طور مکرر به آن‌ها دسترسی داشت، شروع می‌کنند. او در پاسخ به این پرسش که آیا می‌توانیم روزی DNA خودمان را روی دستگاهی در خانه چاپ کنیم، می‌گوید که فکر می‌کند بالاخره این اتفاق خواهد افتاد.

مقاله رو دوست داشتی؟

نظرت چیه؟

مریم صفدری

تبلیغات

داغ‌ترین مطالب روز

نظرات