سومرین؛ رویای بزرگ آمازون در دنیای واقعیت افزوده و مجازی (بخش اول)
آمازون با پروژهای به نام سومرین (Sumerian) در تدارک ورودی باشکوه به دنیای واقعیت مجازی و واقعیت افزوده است. سومرین یک پلتفرم توسعهی چندبعدی برای ساخت اپلیکیشنهای واقعیت مجازی (VR) و واقعیت افزوده (AR) برای دستگاههای مختلف از جمله گوشی موبایل و هدستها است. همچنین به زودی برنامههای AR/VR در مرورگر وب نیز در دسترس خواهد بود.
با استفاده از سومرین میتوانید یک دنیای مجازی سهبعدی پر از هاست (host) خلق کنید. هاستها در واقع شخصیتهای سهبعدی هستند که با استفاده از تکنولوژی هوش مصنوعی الکسا توانایی تعامل با کاربر را دارند.
سومرین با پلتفرمهای مختلف سازگار است، بنابراین به جای تولید یک دستگاه یا هدست مخصوص به آن، آمازون سعی کرده آن را با تکنولوژی موجود سازگار کند. سومرین بر اساس استانداردهای وب باز ساخته شده و از پلتفرمهای ARKit اپل و ARCore گوگل پشتیبانی میکند. بنابراین تولیدکنندگان اپلیکیشنها میتوانند از سومرین برای تولید اپهایی مخصوص اندروید، iOS، Oculus Rift، HTC Vive و غیره استفاده کنند.
سومرین به عنوان افزونهای برای سرویس وب آمازون (AWS) در نظر گرفته شده است و برای استفاده از آن نیازی به نامنویسی نیست و البته با سرویسهای دیگر AWS نیز در ارتباط خواهد بود.
شرکت آمازون برای اولین بار در ماه نوامبر سال گذشته میلادی، پیشنمایشی از سومرین معرفی کرد. در اینجا به گزارشی اختصاصی از سومرین و دیگر برنامههای مشتریمحور آن میپردازیم.
کایل روش (Kyle Roche)، مدیر بخش آمازون سومرین یک دمو از پلتفرم ساخت اپهای سهبعدی نشان داده است. همچنین در ادامه با بخشهای مختلف سومرین از جمله ادیتور اپهای درگ و دراپ، کتابخانهی اشیا سهبعدی و ماشین حالت بصری برای ساخت صحنههای بصری بهصورت اتوماتیک آشنا میشویم. همینطور نگاهی به فرآیند ساخت هاستهای هوشمند خواهیم داشت. کاربران میتوانند در داخل دنیای مجازی با این شخصیتهای سهبعدی، یک مکالمهی کامل و نزدیک به واقعیت داشته باشید.
به بخشهایی از گفتگو با مارکو آرجنتی (Marco Argenti) ، معاون نظارت بر بخشهای AR/VR، AWS Mobile، محاسبات رایانهای بدون سرور و بخشهای اینترنت اشیا نیر میپردازیم. آمازون رویاهای جاهطلبانهای در مورد سومرین در سر دارد و حتی فراتر از آن، درصدد تولید برنامههای بیشتری برای واقعیت مجازی و افزوده و ترکیب آن با هوش مصنوعی در آینده ارتباطات دارد.
چرا آمازون وارد حوزه واقعیت مجازی و افزوده شد؟
شرکت آمازون پیش از این نیز وارد حیطههای جدیدی از فناوری و صنعت شده است. کافی است به شرکت Whole Foods، آمازون ویدیو و تلاشهای چند ماه اخیر آن در زمینهی بهداشت عمومی و صنایع داروسازی نگاهی بیاندازید.
کایل روش با لحنی طنزآلود اشاره میکند که نام سومرین از کتاب علمیتخیلی برخورد برف (Snow Crash) ( که هماکنون آمازون در حال تولید سریالی بر مبنای آن کتاب است) و ایدهی هاستها هم از سریال سریال شبکه HBO با نام جهان غرب (Westworld) برداشت شده است. اما آن طور که آرجنتی میگوید، تصمیم آمازون برای ورود به عرضهی واقعیت مجازی و واقعیت افزوده به سه عامل اصلی برمیگردد: ظهور واقعیت افزوده بر مبنای گوشیهای هوشمند؛ فرصتها و منافع دستنخوردهی واقعیت مجازی در بازار بین کسبوکارها (B2B) و کمک به مشتریان در حل مشکلاتی که در حال کار بر روی آنها هستند.
آرجنتی توضیح میدهد:
این نشانهها بهاندازهی کافی برای ما قدرتمند بودند تا تصمیم به شروع فرآیند طراحی سومرین بگیریم. طبق سنت قدیمی آمازون، ابتدا از آخر شروع به کار کردیم و با نگاه به تجارب مشتریان در نهایت تصمیم به پشتیبانی از یک تیم توسعه برای ساخت محصول گرفتیم.
اپلیکیشنهای بین کسبوکارها مواردی چون علائم دیجیتال تعاملی (همانند هولوگرامهای تبلیغاتی سخنگو در فیلم Blade Runner)، آموزش مجازی و موارد مربوط به میزبانی صنعتی از اینترنت اشیا، همانند ساخت دوقلوهای دیجیتال و شبیهسازیهای پیچیده را شامل میشود. آرجنتی همچنین بر اهمیت واقعیت افزوده بر مبنای گوشی هوشمند و رسیدن آن به نقطهی عطف از طریق ARKit و ARCore تاکید دارد. وی میافزاید:
دوربین به وسیلهای بسیار موثر و قدرتمند برای تعامل با واقعیت و کشف دنیای پیرامون تبدیل شده است. پردازندههای گرافیکی سریع میتوانند به صورت همزمان اطلاعات را بارگذاری کنند و سنسورها به ساختن واقعیت مجازی سهبعدی کمک میکنند. ایدهی ما این است که میلیاردها نفر در سراسر جهان بتوانند سنسورهای با کیفیت بالا و مطلع از محتوا در دست بگیرند.
چگونگی ایجاد سومرین
آمازون ابتدا در این فکر بود که تکنولوژی واقعیت افزوده و واقعیت مجازی در اواخر سال ۲۰۱۶ برای مشتریان سرویس وب دارای چه ویژگیهایی باشد. بعد از یک سال در رویداد AWS یک پیش نمایش از آن نشان داده شد. اما در این مدت چند اتفاق افتاده بود.
ابتدا آمازون یک استارتاپ ورشکستهی سوئدی با نام Goo Technologies را خریداری کرد. در نتیجه بخش تولید محتوای سهبعدی آن با نام Goo Create شالودهی آزمایشگاه توسعه درهمتنیدهی سومرین را تشکیل داد.
مدلسازی بصری سهبعدی آزمایشگاه Goo Create از ابتدا بر مبنای سرویس ابری (cloud service) بوده است، اما آمازون یک قدم فراتر رفت و آن را با خدمات AWS تلفیق کرد. شروع کردن یک پروژه بر پایهی زیرساختهای از پیش طراحیشده برای سرویس ابری دارای مزیتهای زیادی است که بزرگترین آن کاهش شدید دورهی تاخیر است. روش توضیح میدهد که یکی از مزیتهای بزرگ خرید سومرین این است که برای داشتن یک ادیتور پیشرفته و قدرتمند، لازم نیست برنامهای را دانلود یا نصب کنید.
در جریان دموی معرفی، سومرین از طریق یک مرورگر وب و آدرس URL بارگذاری شد. حتی پردازش همزمان زبان طبیعی (NPL) و تولید انیمیشنهای ظریف و پیچیده سرعت آن را چندان پایین نیاورد.
سومرین بهعنوان یک پلتفرم توسعهی کد سطح پایین میتواند بهعنوان اهرمی برای افراد کمتجربه در زمینه کدنویسی و توسعهی اپ مورد استفاده قرار گیرد. با این حال کدنویسان و متخصصان دیتا میتوانند با استفاده از APIهای قابل برنامهریزی و رابط خط فرمان سومرین، استفادههای عمیقتری از آن کرده و محیطهای متنوعتر و منطقهای پیچیدهتری تولید کنند.
آرجنتی در این مورد توضیح میدهد:
ما میخواهیم تجربهی کاربر با سومرین به این صورت باشد که تنها با یک کلیک فورا وارد محیط شود. سپس شما یک محیط گرافیکی سهبعدی دارید که میتوانید اشیا را بگیرید و در محیط قرار دهید. سومرین یک ابزار بصری است که باعث ارتباط دستور با پدیدهی است که اتفاق میافتد، بدون این که لازم باشد حتی یک خط کد نوشته شود.
تولید اپلیکیشنهای سهبعدی سومرین
فلفسهای که آمازون در طراحی سومرین پیش گرفت این بود که تجربهی خلق محتوا تا جایی که امکان دارد برجسته باشد. روش توضیح میدهد:
هدف ما این بود که تا جای ممکن کارهای توسعهای تکراری را در پشت پرده قرار دهیم و در نتیجه فرآیند ساخت یک اپ سومرین صرف نظر از این که برای پلتفرم واقعیت مجازی یا واقعیت افزوده ساخته میشود، یکسان باشد.
برای ساخت اپ باید تصمیم بگیرید که از یک قالب استفاده کنید؛ یا مستقیما وارد ساخت محیط شوید. بعضی از قالبهای پیشفرض سومرین شامل محیطهایی همچون محیط دفتری، محیطهای ورزشی، انبارها، کشتی باربری و کمپ پیکنیک است. ادیتور اصلی سومرین از WebGL و WebVR پشتیبانی میکند و نحوهی عملکرد آن همانند ابزارهای کد پایین دیگری است که پیش از این آزمایش شدهاند.
در سومرین میتوانید اکثر فرمتهای مربوط به فایلهای سهبعدی را وارد برنامه کنید
در سمت چپ پنل انتیتی (entity) قرار دارد. انتیتی اساسا جدول یا یک table در دیتابیس است که به شما کمک میکند دادهها وارد اپ شما شوند. در پایین آن، پنجرهی اسرت (assert) قرار دارد، که به کاربر کمک میکند شی مورد نظر خود را پیدا کرده و وارد صحنه کند؛ یا کل کتابخانهی مربوط به آن از بین تمام مدلهای سهبعدی سومرین را جستجو کند.
روش میگوید سومرین از چند کتابخانهی اشیا متن باز پشتیبانی کرده و با رابط کاربری Sketchfab هماهنگ است. آمازون همچنین برای همکاری با پلتفرمهایی نظیر TurboSquid و کتابخانهی اشیای AR/VR با نام Poly متعلق به گوگل اعلام آمادگی کرده است. روش میگوید که در سومرین شما میتوانید ابزارهای خود را نیز وارد برنامه کرده و آنها را داخل محیط کشیده و رها سازید.
روش توضیح میدهد:
میتوانید اکثر فرمتهای مربوط به فایلهای سهبعدی را وارد برنامه کنید. ما آنها را برای کاربر، تبدیل، بهینه و ذخیره میکنیم. یکی از موارد جالبی که سومرین انجام میدهد، این است که اگر کاربر از یک کارایی یا ابزار در چند محیط استفاده کند، برنامه برای آن یک لینک مرجع تولید میکند.
در مرکز تصویر، محیط اصلی برنامه قرار دارد؛ جایی که کاربر میتواند ابزارها و مدلهای سهبعدی را وارد آن کند. در گوشهی کانواس نیز دکمهای قرار دارد که با کلیک روی آن، پیشنمایشی از محیط شما در WebVR نشان داده میشود.
در پایین آن ادیتور جدول زمانی قرار دارد، شبیه به آن چیزی که در برنامههای ویرایش ویدیو دیدهایم. هنگامی که انیمیشنها و صداها را وارد فریمها کرده و از ماشین حالت بصری برای تولید فعالیتها، رفتارهای هاستها و تسلسل اتفاقات استفاده میکنید، همهی این موارد در جدول زمانی نمایش داده میشوند و شما میتوانید سیر پیشروی این موارد را تنظیم کنید.
در سمت راست نیز پنل بازرسی قرار دارد، که شامل جزییات هر بخش و نحوهی تغییر و شخصیسازی آن است. در یک مدل ممکن است صدها متغیر مختلف وجود داشته باشد، اما شما با استفاده از این پنل میتوانید حالات و ویژگیهای آنها را بدون تغییر دادن محیط تنظیم کنید.
استراتژی آمازون: با همه هماهنگ باش
سومرین نهتنها با پلتفرمهای توسعهای سهبعدی همچون Unity، Unreal Engine و Vuforia هماهنگ است بلکه بهصورت کلیتر با محیطهای AR/VR و ARKit، ARCore و واقعیت تریکیب ویندوز (WMR) نیز سازگاری دارد. روش میگوید که سومرین از فلسفهی «یک بار تولید کن، در همه جا اجرا کن» در تولید اپهای AR/VR و به خصوص برای توسعهدهندگان صنعتی پیروی میکند. وی میافزاید:
توسعهدهندگان حرفهای سهبعدی یا انیمیتورهای حرفهای در قالب یک استودیو کار میکنند؛ اما بیشتر کاربران سرویس وب آمازون از توسعهدهندگان اپهای موبایل یا وب هستند که در حین انجام پروژه، کار با Unity را یاد میگیرند. البته پلتفرم Unity بسیار خوب است، اما استفادهی کامل از آن کار مشکلی است. توسعهدهندگان باید مهارتهای لازم برای کار با آن را یاد بگیرند، همچون کار با جاوا اسکریپت؛ و از این مهارتها در محیط سهبعدی استفاده کنند. بنابراین ما تصمیم گرفتیم تمرکز خود را بر روی این بخش از بازار قرار دهیم.
برنامهی سومرین از استانداردهای متن باز متعددی پشتیبانی میکند: WebGL، WebAR، WebVR و پلتفرم جدید WebXR. در قالب این پلتفرم تمام اپهای AR/VR به تجهیزات و مرورگرهای مختلف راه خواهند یافت. کنسرسیوم جهانی وب در ماههای آتی برای تایید پلتفرم WebXR رایگیری خواهد کرد. در آن زمان اپهای سومرین برای اجرا در مرورگرهای اینترنتی آماده خواهند بود. روش میگوید که با سومرین میتوان برای پلتفرمهایی که از WebVR پشتیبانی میکنند، برنامههای کاربردی ساخت. در این صورت نه تنها Oculus Rift، بلکه HTC Vive و پروژه واقعیت مجازی سامسونگ، Daydream View گوگل و دیگر پلتفرمها به خوبی با سومرین سازگاری خواهند داشت. همچنین تیم توسعهی سومرین با تیم گوگل کروم در مورد WebXR در مورد برنامههای مبتنی بر وب همکاری دارد.
بازیگر اصلی دیگر این میدان، مایکروسافت است. با این که آمازون بهصورت مستقیم اعلام نکرده است که سومرین با واقعیت ترکیبی ویندوز سازگاری خواهد داشت، اما روش میگوید آخرین نسخهی RS4 از HoloLens مایکروسافت از استاندارد WebAR پشتیبانی میکند، بنابراین سومرین میتواند محیطهای HoloLens را نیز اجرا کند. همچنین آمازون پیشرفت هدستهای واقعیت مجازی دیگری همچون Magic Leap و Meta را زیر نظر دارد. در هر صورت ساختار انعطافپذیر سومرین قابلیت هماهنگی با دستگاههای مختلف را دارد.
آرجنتی در این مورد میگوید:
ما تصمیم خود را گرفتهایم. ما میتوانستیم کار خود را انجام دهیم و یک برنامهی انحصاری توسعه دهیم و توسعهدهندگان را به طرف آن سوق دهیم؛ اما بهجای آن تصمیم گرفتیم تا جایی که ممکن باشد، سومرین را با قابلیت سازگاری بیشتری بسازیم تا بازار بزرگتری را در بر بگیرد. زمانی که همهچیز به سمت WebXR سوق پیدا کند، تمام اکوسیستم برنامه با آن عرضه خواهد شد. ما به دنبال ساختار پایهای رفتیم.
هاستهای سومرین تعیینکننده هستند
هاستهای سومرین از نقاط جذاب آن برای خرید به شمار میروند. هاست یک شخصیت انیمیشنی سهبعدی است که شما میتوانید وارد محیطهای واقعیت افزوده (AR) یا واقعیت مجازی (VR) کنید. کاربران میتوانند از هاستها سوال بپرسند و توسعهدهندگان میتوانند مجموعهای از اعمال، رفتار، حرکات و احساسات مختلف را در یک هاست ایجاد کنند؛ بنابراین هاست با توجه به جریان مکالمه میتواند در صحنه حرکت کند و واکنش نشان دهد. روش میگوید ایدهی مربوط به هاستها از جاهای مختلفی نشات گرفته است؛ از جمله بازیهای آنلاینی همچون Second Life یا بازی Sims.
آمازون در ساخت هاستها به جزییات زیادی توجه کرده است
سومرین در حال حاضر دارای دو هاست با نامهای کریستین (Cristine) و پرستون (Preston) است. اما در آینده مجموعهی کاملی از هاستها توسط آمازون معرفی خواهند شد. آمازون در ساخت این هاستها به جزییات زیادی توجه کرده است. روش دمویی از کریستی نشان داده است که در آن هاست را وارد صحنه کرده و پنل راست را باز و از آنجا احساسات، رفتار، حالت چهره و حرکات او را تنظیم کرد. آمازون سعی دارد تا هاستها را بهگونهای طراحی کند که حالات چهره آنها و رفتارشان مطابق با جریان طبیعی مکالمه تغییر کند. بنابراین وقتی کریستی به شما میگوید سلام، ممکن است دست خود را برای شما تکان دهد.
شما میتوانید در بخش ادیتور با چک کردن یک باکس از هاست بخواهید به سمت دوربین نگاه کنید. بنابراین اگر شما یک هدست HTC Vive Pro پوشیده باشید و در یک محیط ۳۶۰ درجه شبیهسازی شده قدم بزنید، هاست میتواند شما را دنبال کند. روش همچنین میگوید اگر از یک اپ واقعیت افزوده در گوشی خود استفاده کنید، سومرین با سیستم یادگیری عمیق میتواند با آنالیز تصویری از چهرهی کاربر در داخل فرم و مکان او، طوری جلوه دهد که کاربر تصور کند که هاست از طریق صفحه نمایش گوشی مستقیما به او نگاه میکند. با این روش تصور میکنید که هاست با شما ارتباط چشمی برقرار کرده است.
کاربران همینطور میتوانند با استفاده از قابلیت Maya SDK هاستهای شخصی خود را از ابتدا بسازند؛ اما آمازون میتواند اسکلت یک هاست را برای شما خلق کند و سپس میتوانید ظاهر هاست، گویش، زبان و تن صدای آن را تنظیم کنید. اما در بلند مدت آمازون قصد دارد ساخت هاستها را برای کاربران راحتتر کند. آرجنتی اکنون در مورد ایدهی هاستسازی برای آواتارهای اول شخص و همچنین قابلیت تشخیص چهره برای خلق هاستهای مشابه کاربران صحبت میکند. او میگوید:
با همکاری پروژهی Rekocnition آمازون، اگر ما بتوانیم بهصورت رویهای کاراکترهای بسیار زیادی بسازیم، آن گاه میتوانیم شبیهترین آواتار به شما را پیشنهاد کنیم. ما عکس شما را میگیریم و با استفاده از تشخیص چهره معکوس میتوانیم از بین کاراکترهای تصادفی، شبیهترین هاست به شما را پیدا کنیم.
آرجنتی توضیح میدهد که چگونه سرویسهای دیگر AWS میتوانند به خلق هاستها و شبیه کردن آنها به افراد واقعی کمک کنند. از جمله این سرویسها میتوان به Amazon Comprehend اشاره کرد. Comprehend سرویس پردازش زبان طبیعی است که با تحلیل نوشتار، اطلاعات مربوط به مواردی شبیه خلق و خوی را استخراج میکند. بر این اساس هاست میتواند در طول مکالمه با توجه به روحیهی کاربر و شرایطی که در آن قرار دارند، حالات چهره یا طرز رفتار مختلفی داشته باشد. آرجنتی میگوید:
اگر کاربر عصبانی باشد، ممکن است هاست سعی کند او را آرام کند. اکنون نهتنها در روش انتقال پیام، بلکه در نحوهی نمایش احساسات عمیق و پردازش آنها در حال پیشرفت هستیم.
ادامه دارد...