سومرین؛ رویای بزرگ آمازون در دنیای واقعیت افزوده و مجازی (بخش اول)

جمعه ۲۲ تیر ۱۳۹۷ - ۱۲:۰۰
مطالعه 12 دقیقه
مدتی است که آمازون با پروژه‌ی سومرین، وارد دنیای مهیج واقعیت مجازی و واقعیت افزوده شده است؛ اما سومرین دقیقا چیست؟
تبلیغات

آمازون با پروژه‌ای به نام سومرین (Sumerian) در تدارک ورودی باشکوه به دنیای واقعیت مجازی و واقعیت افزوده است. سومرین یک پلتفرم توسعه‌ی چند‌بعدی برای ساخت اپلیکیشن‌های واقعیت مجازی (VR) و واقعیت افزوده (AR) برای دستگاه‌های مختلف از جمله گوشی موبایل و هدست‌ها است. همچنین به زودی برنامه‌های AR/VR در مرورگر وب نیز در دسترس خواهد بود.

با استفاده از سومرین می‌توانید یک دنیای مجازی سه‌بعدی پر از هاست‌ (host) خلق کنید. هاست‌ها در واقع شخصیت‌های سه‌بعدی هستند که با استفاده از تکنولوژی هوش مصنوعی الکسا توانایی تعامل با کاربر را دارند.

سومرین با پلتفرم‌های مختلف سازگار است، بنابر‌این به جای تولید یک دستگاه یا هدست مخصوص به آن، آمازون سعی کرده آن را با تکنولوژی موجود سازگار کند. سومرین بر اساس استانداردهای وب باز ساخته شده و از پلتفرم‌های ARKit اپل و ARCore گوگل پشتیبانی می‌کند. بنابراین تولیدکنندگان اپلیکیشن‌ها می‌توانند از سومرین برای تولید اپ‌هایی مخصوص اندروید، iOS، Oculus Rift، HTC Vive و غیره استفاده کنند.

سومرین به عنوان افزونه‌ای برای سرویس وب آمازون (AWS) در نظر گرفته شده است و برای استفاده از آن نیازی به نام‌نویسی نیست و البته با سرویس‌های دیگر AWS نیز در ارتباط خواهد بود.

شرکت آمازون برای اولین بار در ماه نوامبر سال گذشته میلادی، پیش‌نمایشی از سومرین معرفی کرد. در اینجا به گزارشی اختصاصی از سومرین و دیگر برنامه‌های مشتری‌محور آن می‌پردازیم.

کایل روش (Kyle Roche)، مدیر بخش آمازون سومرین یک دمو از پلتفرم ساخت اپ‌های سه‌بعدی نشان داده است. همچنین در ادامه با بخش‌های مختلف سومرین از جمله ادیتور اپ‌های درگ و دراپ، کتابخانه‌‌ی اشیا سه‌بعدی و ماشین حالت بصری برای ساخت صحنه‌های بصری به‌صورت اتوماتیک آشنا می‌شویم. همین‌طور نگاهی به فرآیند ساخت هاستهای هوشمند خواهیم داشت. کاربران می‌توانند در داخل دنیای مجازی با این شخصیت‌های سه‌بعدی، یک مکالمه‌ی کامل و نزدیک به واقعیت داشته باشید.

به بخش‌هایی از گفتگو با مارکو آرجنتی (Marco Argenti) ، معاون نظارت بر بخش‌های AR/VR، AWS Mobile، محاسبات رایانه‌ای بدون سرور و بخش‌های اینترنت اشیا نیر می‌پردازیم. آمازون رویاهای جاه‌طلبانه‌ای در مورد سومرین در سر دارد و حتی فراتر از آن، درصدد تولید برنامه‌های بیشتری برای واقعیت مجازی و افزوده و ترکیب آن با هوش مصنوعی در آینده ارتباطات دارد.

سومرین آمازون

چرا آمازون وارد حوزه‌  واقعیت مجازی و افزوده شد؟

شرکت آمازون پیش از این نیز وارد حیطه‌های جدیدی از فناوری و صنعت شده است. کافی است به شرکت Whole Foods، آمازون ویدیو و تلاش‌های چند ماه اخیر آن در زمینه‌ی بهداشت عمومی و صنایع داروسازی نگاهی بیاندازید.

کایل روش با لحنی طنزآلود اشاره می‌کند که نام سومرین از کتاب علمی‌تخیلی برخورد برف (Snow Crash) ( که هم‌اکنون آمازون در حال تولید سریالی بر مبنای آن کتاب است) و ایده‌ی هاستها هم از سریال سریال شبکه HBO با نام جهان‌ غرب (Westworld) برداشت شده است. اما آن طور که آرجنتی می‌گوید، تصمیم آمازون برای ورود به عرضه‌ی واقعیت مجازی و واقعیت افزوده به سه عامل اصلی برمی‌گردد: ظهور واقعیت افزوده بر مبنای گوشی‌های هوشمند؛ فرصت‌ها و منافع دست‌نخورده‌ی واقعیت مجازی در بازار بین کسب‌و‌کارها (B2B) و کمک به مشتریان در حل مشکلاتی که در حال کار بر روی آن‌ها هستند.

آرجنتی توضیح می‌دهد:

این نشانه‌ها به‌اندازه‌ی کافی برای ما قدرتمند بودند تا تصمیم به شروع فرآیند طراحی سومرین بگیریم. طبق سنت قدیمی آمازون، ابتدا از آخر شروع به کار کردیم و با نگاه به تجارب مشتریان در نهایت تصمیم به پشتیبانی از یک تیم توسعه برای ساخت محصول گرفتیم.

اپلیکیشن‌های بین کسب‌وکارها مواردی چون علائم دیجیتال تعاملی (همانند هولوگرام‌های تبلیغاتی سخن‌گو در فیلم Blade Runner)، آموزش مجازی و موارد مربوط به میزبانی صنعتی از اینترنت اشیا، همانند ساخت دوقلوهای دیجیتال و شبیه‌سازی‌های پیچیده را شامل می‌شود. آرجنتی همچنین بر اهمیت واقعیت افزوده بر مبنای گوشی هوشمند و رسیدن آن به نقطه‌ی عطف از طریق ARKit و ARCore تاکید دارد. وی می‌افزاید:

دوربین به وسیله‌ای بسیار موثر و قدرتمند برای تعامل با واقعیت و کشف دنیای پیرامون تبدیل شده است. پردازنده‌های گرافیکی سریع می‌توانند به صورت همزمان اطلاعات را بارگذاری کنند و سنسورها به ساختن واقعیت مجازی سه‌بعدی کمک می‌کنند. ایده‌ی ما این است که میلیاردها نفر در سراسر جهان بتوانند سنسورهای با کیفیت بالا و مطلع از محتوا در دست بگیرند.
آمازون

چگونگی ایجاد سومرین

آمازون ابتدا در این فکر بود که تکنولوژی واقعیت افزوده و واقعیت مجازی در اواخر سال ۲۰۱۶ برای مشتریان سرویس وب دارای چه ویژگی‌هایی باشد. بعد از یک سال در رویداد AWS یک پیش نمایش از آن نشان داده شد. اما در این مدت چند اتفاق افتاده بود.

ابتدا آمازون یک استارتاپ ورشکسته‌ی سوئدی با نام Goo Technologies‌ را خریداری کرد. در نتیجه بخش تولید محتوای سه‌بعدی آن با نام Goo Create شالوده‌ی آزمایشگاه توسعه درهم‌تنیده‌ی سومرین را تشکیل داد.

مدل‌سازی بصری سه‌بعدی آزمایشگاه Goo Create از ابتدا بر مبنای سرویس ابری (cloud service) بوده است، اما آمازون یک قدم فراتر رفت و آن را با خدمات AWS تلفیق کرد. شروع کردن یک پروژه بر پایه‌ی زیر‌ساخت‌های از پیش طراحی‌شده برای سرویس ابری دارای مزیت‌های زیادی است که بزرگ‌ترین آن کاهش شدید دوره‌ی تاخیر است. روش توضیح می‌دهد که یکی از مزیت‌های بزرگ خرید سومرین این است که برای داشتن یک ادیتور پیشرفته و قدرتمند،‌ لازم نیست برنامه‌ای را دانلود یا نصب کنید.

در جریان دموی معرفی، سومرین از طریق یک مرورگر وب و آدرس URL بارگذاری شد. حتی پردازش همزمان زبان طبیعی (NPL) و تولید انیمیشن‌های ظریف و پیچیده سرعت آن را چندان پایین نیاورد.

سومرین به‌عنوان یک پلتفرم توسعه‌ی کد سطح پایین می‌تواند به‌عنوان اهرمی برای افراد کم‌تجربه در زمینه کدنویسی و توسعه‌ی اپ مورد استفاده قرار گیرد. با این حال کدنویسان و متخصصان دیتا می‌توانند با استفاده از APIهای قابل برنامه‌ریزی و رابط خط فرمان سومرین، استفاده‌های عمیق‌تری از آن کرده و محیط‌های متنوع‌تر و منطق‌های پیچیده‌تری تولید کنند.

آرجنتی در این مورد توضیح می‌دهد:

ما می‌خواهیم تجربه‌ی کاربر با سومرین به این صورت باشد که تنها با یک کلیک فورا وارد محیط شود. سپس شما یک محیط گرافیکی سه‌بعدی دارید که می‌توانید اشیا را بگیرید و در محیط قرار دهید. سومرین یک ابزار بصری است که باعث ارتباط دستور با پدیده‌ی است که اتفاق می‌افتد، بدون این که لازم باشد حتی یک خط کد نوشته شود.

تولید اپلیکیشن‌های سه‌بعدی سومرین

فلفسه‌ای که آمازون در طراحی سومرین پیش گرفت این بود که تجربه‌ی خلق محتوا تا جایی که امکان دارد برجسته باشد. روش توضیح می‌دهد:

هدف ما این بود که تا جای ممکن کارهای توسعه‌ای تکراری را در پشت پرده قرار دهیم و در نتیجه فرآیند ساخت یک اپ سومرین صرف نظر از این که برای پلتفرم واقعیت مجازی یا واقعیت افزوده ساخته می‌شود، یکسان باشد.

برای ساخت اپ باید تصمیم بگیرید که از یک قالب استفاده کنید؛ یا مستقیما وارد ساخت محیط شوید. بعضی از قالب‌های پیش‌فرض سومرین شامل محیط‌هایی هم‌چون محیط دفتری، محیط‌های ورزشی، انبار‌ها، کشتی باربری و کمپ پیک‌نیک است. ادیتور اصلی سومرین از WebGL و WebVR پشتیبانی می‌کند و نحوه‌ی عملکرد آن همانند ابزارهای کد پایین دیگری است که پیش از این آزمایش شده‌اند.

در سومرین می‌توانید اکثر فرمت‌های مربوط به فایل‌های سه‌بعدی را وارد برنامه کنید

در سمت چپ پنل انتیتی (entity) قرار دارد. انتیتی اساسا جدول یا یک table در دیتابیس است که به شما کمک می‌کند داده‌ها وارد اپ شما شوند. در پایین آن، پنجره‌ی اسرت (assert) قرار دارد، که به کاربر کمک می‌کند شی مورد نظر خود را پیدا کرده و وارد صحنه کند؛ یا کل کتابخانه‌ی مربوط به آن از بین تمام مدل‌های سه‌بعدی سومرین را جستجو کند.

روش می‌گوید سومرین از چند کتابخانه‌ی اشیا متن باز پشتیبانی کرده و با رابط کاربری Sketchfab هماهنگ است. آمازون همچنین برای همکاری با پلتفرم‌هایی نظیر TurboSquid و کتابخانه‌ی اشیای AR/VR با نام Poly متعلق به گوگل اعلام آمادگی کرده است. روش می‌گوید که در سومرین شما می‌توانید ابزارهای خود را نیز وارد برنامه کرده و آنها را داخل محیط کشیده و رها سازید.

روش توضیح می‌دهد:

می‌توانید اکثر فرمت‌های مربوط به فایل‌های سه‌بعدی را وارد برنامه کنید. ما آن‌ها را برای کاربر، تبدیل، بهینه و ذخیره می‌کنیم. یکی از موارد جالبی که سومرین انجام می‌دهد، این است که اگر کاربر از یک کارایی یا ابزار در چند محیط استفاده کند‌، برنامه برای آن یک لینک مرجع تولید می‌کند.

در مرکز تصویر، محیط اصلی برنامه قرار دارد؛ جایی که کاربر می‌تواند ابزارها و مدل‌های سه‌بعدی را وارد آن کند. در گوشه‌ی کانواس نیز دکمه‌ای قرار دارد که با کلیک روی آن، پیش‌نمایشی از محیط شما در WebVR نشان داده می‌شود.

طراحی سه بعدی سومرین

در پایین آن ادیتور جدول زمانی قرار دارد، شبیه به آن چیزی که در برنامه‌های ویرایش ویدیو دیده‌ایم. هنگامی که انیمیشن‌ها و صداها را وارد فریم‌ها کرده و از ماشین حالت بصری برای تولید فعالیت‌ها، رفتارهای هاستها و تسلسل اتفاقات استفاده می‌کنید، ‌همه‌ی این موارد در جدول زمانی نمایش داده می‌شوند و شما می‌توانید سیر پیش‌روی این موارد را تنظیم کنید.

در سمت راست نیز پنل بازرسی قرار دارد، که شامل جزییات هر بخش و نحوه‌ی تغییر و شخصی‌سازی آن است. در یک مدل ممکن است صدها متغیر مختلف وجود داشته باشد، اما شما با استفاده از این پنل می‌توانید حالات و ویژگی‌های آن‌ها را بدون تغییر دادن محیط تنظیم کنید.

استراتژی آمازون: با همه هماهنگ باش

سومرین نه‌تنها با پلتفرم‌های توسعه‌ای سه‌بعدی هم‌چون Unity، Unreal Engine و Vuforia هماهنگ است بلکه به‌صورت کلی‌تر با محیط‌های AR/VR و ARKit، ARCore و واقعیت تریکیب ویندوز (WMR) نیز سازگاری دارد. روش می‌گوید که سومرین از فلسفه‌ی «یک بار تولید کن، در همه جا اجرا کن» در تولید اپ‌های AR/VR و به خصوص برای توسعه‌دهندگان صنعتی پیروی می‌کند. وی می‌افزاید:

توسعه‌دهندگان حرفه‌ای سه‌بعدی یا انیمیتورهای حرفه‌ای در قالب یک استودیو کار می‌کنند؛ اما بیشتر کاربران سرویس وب آمازون از توسعه‌دهندگان اپ‌های موبایل یا وب هستند که در حین انجام پروژه، کار با Unity‌ را یاد می‌گیرند. البته پلتفرم Unity بسیار خوب است،‌ اما استفاده‌ی کامل از آن کار مشکلی است. توسعه‌دهندگان باید مهارت‌های لازم برای کار با آن را یاد بگیرند، هم‌چون کار با جاوا اسکریپت؛ و از این مهارت‌ها در محیط سه‌بعدی استفاده کنند. بنابراین ما تصمیم گرفتیم تمرکز خود را بر روی این بخش از بازار قرار دهیم.

برنامه‌ی سومرین از استانداردهای متن باز متعددی پشتیبانی می‌کند: WebGL، WebAR، WebVR و پلتفرم جدید WebXR. در قالب این پلتفرم تمام اپ‌های  AR/VR‌ به تجهیزات و مرورگرهای مختلف راه خواهند یافت. کنسرسیوم جهانی وب در ماه‌های آتی برای تایید پلتفرم WebXR رای‌گیری خواهد کرد. در آن زمان اپ‌های سومرین برای اجرا در مرورگرهای اینترنتی آماده خواهند بود. روش می‌گوید که با سومرین می‌توان برای پلتفرم‌هایی که از WebVR پشتیبانی می‌کنند، برنامه‌های کاربردی ساخت. در این صورت نه تنها Oculus Rift، بلکه HTC Vive و پروژه واقعیت مجازی سامسونگ، Daydream View گوگل و دیگر پلتفرم‌ها به خوبی با سومرین سازگاری خواهند داشت. همچنین تیم توسعه‌ی سومرین با تیم گوگل کروم در مورد WebXR در مورد برنامه‌های مبتنی بر وب همکاری دارد.

بازیگر اصلی دیگر این میدان، مایکروسافت است. با این که آمازون به‌صورت مستقیم اعلام نکرده است که سومرین با واقعیت ترکیبی ویندوز سازگاری خواهد داشت، اما روش می‌گوید آخرین نسخه‌ی RS4 از HoloLens مایکروسافت از استاندارد WebAR پشتیبانی می‌کند، بنابراین سومرین می‌تواند محیط‌های HoloLens را نیز اجرا کند. همچنین آمازون پیشرفت هدست‌های واقعیت مجازی دیگری همچون Magic Leap و Meta‌ را زیر نظر دارد. در هر صورت ساختار انعطاف‌پذیر سومرین قابلیت هماهنگی با دستگاه‌های مختلف را دارد.

آرجنتی در این مورد می‌گوید:

ما تصمیم خود را گرفته‌ایم. ما می‌توانستیم کار خود را انجام دهیم و یک برنامه‌ی انحصاری توسعه دهیم و توسعه‌دهندگان را به طرف آن سوق دهیم؛ اما به‌جای آن تصمیم گرفتیم تا جایی که ممکن باشد، سومرین را با قابلیت سازگاری بیشتری بسازیم تا بازار بزرگتری را در بر بگیرد. زمانی که همه‌چیز به سمت WebXR سوق پیدا کند، تمام اکوسیستم برنامه با آن عرضه خواهد شد. ما به دنبال ساختار پایه‌ای رفتیم.

هاست‌های سومرین تعیین‌کننده هستند

هاست‌های سومرین از نقاط جذاب آن برای خرید به شمار می‌روند. هاست یک شخصیت انیمیشنی سه‌بعدی است که شما می‌توانید وارد محیط‌های واقعیت افزوده (AR‌) یا واقعیت مجازی (VR) کنید. کاربران می‌توانند از هاست‌ها سوال بپرسند و توسعه‌دهندگان می‌توانند مجموعه‌ای از اعمال، رفتار، حرکات و احساسات مختلف را در یک هاست ایجاد کنند؛ بنابراین هاست با توجه به جریان مکالمه می‌تواند در صحنه حرکت کند و واکنش نشان دهد. روش می‌گوید ایده‌ی مربوط به هاست‌ها از جاهای مختلفی نشات گرفته است؛ از جمله بازی‌های آنلاینی هم‌چون Second Life یا بازی Sims.

 آمازون در ساخت هاست‌ها به جزییات زیادی توجه کرده است

سومرین در حال حاضر دارای دو هاست با نام‌های کریستین (Cristine) و پرستون (Preston) است. اما در آینده مجموعه‌ی کاملی از هاست‌ها توسط آمازون معرفی خواهند شد. آمازون در ساخت این هاست‌ها به جزییات زیادی توجه کرده است. روش دمویی از کریستی نشان داده است که در آن هاست را وارد صحنه کرده و پنل راست را باز و از آن‌جا احساسات، رفتار، حالت چهره و حرکات او را تنظیم کرد. آمازون سعی دارد تا هاست‌ها را به‌گونه‌ای طراحی کند که حالات چهره آن‌ها و رفتارشان مطابق با جریان طبیعی مکالمه تغییر کند. بنابراین وقتی کریستی به شما می‌گوید سلام، ممکن است دست خود را برای شما تکان دهد.

هاست سومرین آمازون

شما می‌توانید در بخش ادیتور با چک کردن یک باکس از هاست بخواهید به سمت دوربین نگاه کنید. بنابراین اگر شما یک هدست HTC Vive Pro پوشیده باشید و در یک محیط ۳۶۰  درجه شبیه‌سازی شده قدم بزنید، هاست می‌تواند شما را دنبال کند. روش هم‌چنین می‌گوید اگر از یک اپ واقعیت افزوده در گوشی خود استفاده کنید، سومرین با سیستم یادگیری عمیق می‌تواند با آنالیز تصویری از چهره‌ی کاربر در داخل فرم و مکان او، طوری جلوه دهد که کاربر تصور کند که هاست از طریق صفحه نمایش گوشی مستقیما به او نگاه می‌کند. با این روش تصور می‌کنید که هاست با شما ارتباط چشمی برقرار کرده است.

کاربران همین‌طور می‌توانند با استفاده از قابلیت Maya SDK هاستهای شخصی خود را از ابتدا بسازند؛ اما آمازون می‌تواند اسکلت یک هاست را برای شما خلق کند و سپس می‌توانید ظاهر هاست، گویش، زبان و تن صدای آن را تنظیم کنید. اما در بلند مدت آمازون قصد دارد ساخت هاستها را برای کاربران راحت‌تر کند. آرجنتی اکنون در مورد ایده‌ی هاستسازی برای آواتار‌های اول شخص و همچنین قابلیت تشخیص چهره برای خلق هاستهای مشابه کاربران صحبت می‌کند. او می‌گوید:

با همکاری پروژه‌ی Rekocnition آمازون، اگر ما بتوانیم به‌صورت رویه‌ای کاراکترهای بسیار زیادی بسازیم، آن گاه می‌توانیم شبیه‌ترین آواتار به شما را پیشنهاد کنیم. ما عکس شما را می‌گیریم و با استفاده از تشخیص چهره معکوس می‌توانیم از بین کاراکترهای تصادفی، شبیه‌ترین هاست به شما را پیدا کنیم.

آرجنتی توضیح می‌دهد که چگونه سرویس‌های دیگر AWS می‌توانند به خلق هاست‌ها و شبیه کردن آنها به افراد واقعی کمک کنند. از جمله این سرویس‌ها می‌توان به Amazon Comprehend اشاره کرد. Comprehend سرویس پردازش زبان طبیعی است که با تحلیل نوشتار، اطلاعات مربوط به مواردی شبیه خلق و خوی را استخراج می‌کند. بر این اساس هاست می‌تواند در طول مکالمه با توجه به روحیه‌ی کاربر و شرایطی که در آن قرار دارند، حالات چهره یا طرز رفتار مختلفی داشته باشد. آرجنتی می‌گوید:

اگر کاربر عصبانی باشد، ممکن است هاست سعی کند او را آرام کند. اکنون نه‌تنها در روش انتقال پیام، بلکه در نحوه‌ی نمایش احساسات عمیق و پردازش آنها در حال پیشرفت هستیم.

ادامه دارد...

تبلیغات
داغ‌ترین مطالب روز

نظرات

تبلیغات