API یادگیری ماشینی گوگل اشیاء مختلف را در ویدیوها تشخیص میدهد
API جدید یادگیری ماشینی گوگل هماکنون میتواند اشیاء مختلف را در ویدیوها تشخیص دهد. البته این سیستم فعلا در مراحل ابتدایی قرار دارد ولی دستیابی به همین سطح هم خود یک گام بزرگ در تکنولوژی یادگیری ماشینی است. گوگل در کنفرانس نکستکلود خود با اعلام جزئیاتی در مورد API جدید که آن را API ابر هوش ویدویی نامیده، توجهات زیادی را به خود جلب کرده است. گوگل در کنفرانس مورد اشاره نمونهای نمایشی از API جدیدش را بهنمایش گذاشت و جزئیات مختصری هم در مورد روش کارکرد و قابلیتهای آن بیان کرد.
گوگل در کنفرانس نکستکلود ویدیویی از یک ببر را پخش کرده و در سمت راست پایین این ویدیو لیستی شامل نام اشیاء مختلف بهنمایش درآمده است که همگی توسط API گوگل تشخیص داده شدهاند. این آیتمها در واقع نام مواردی است که احتمال دارد در ویدیو مورد نظر وجود داشته باشند و در کنار هر آیتم درصد اطمینان از وجود آن در ویدیو قرار داده شده است. پس از پخش شدن ویدیویی که در آن یک ببر وجود داشت، در کنار نام ببر عدد ۹۰.۱۱ درصد بهنمایش درآمد. البته کلمهی ببر سومین آیتمی بوده که توسط API جدید یادگیری ماشینی گوگل ایجاد شده و در بالای آن دو کلمهی حیوان و حیات وحش نیز توسط این API شناسایی شده که هر دو این کلمهها درست تشخیص داده شدهاند. گوگل از مدل Tensor Flow و مدلهای دیگر یادگیری ماشینی به عنوان چهارچوب اصلی این API جدید استفاده کرده و در حال حاضر این API در مرحلهی بتای خصوصی قرار دارد. به این ترتیب توسعهدهندگان میتوانند برای تست API جدید یادگیری ماشینی گوگل ثبتنام کنند تا از آن به طور آزمایشی در پروژههای مورد نظر خود بهره ببرند.
در نسخهی قبلی API گوگل که به منظور تشخیص موارد موجود در ویدیوها بهکار میرفت از برچسبهای دستی استفاده میشد، اما در نسخهی جدید این API امکانی فراهم شده تا آیتمهای موجود در ویدیوها به طور واقعی شناسایی شوند. در حال حاضر اگر ویدیوهای تبلیغاتی برای معرفی محصولات مشخص پخش شوند، API ابرهوش ویدیویی گوگل بهخوبی میتواند آن محصول را تشخیص داده و بدین ترتیب این موضوع را درک کند که ویدیو یاد شده از نوع تبلیغاتی است. اما در کنفرانس نکستکلود و پس از پخش ویدیویی که در آن یک ببر وجود داشت، گوگل اعلام کرد که توسعهدهندگان میتوانند با API جدید این شرکت محتوای مورد نظر خود را در ویدیوهایی که در فضای ذخیرهسازی ابری گوگل قرار دارند با استفاده از کلمات کلیدی مثل «Tiger» جستجو کنند؛ در این مورد اگر کلمهی Tiger جستجو شود، در بخش نتایج تمامی ویدیوهایی که در آنها ببر وجود داشته باشد به نمایش در میآیند. البته قابلیتهای API جدید گوگل شاید فعلا برای کاربران عادی کاربرد چندانی نداشته باشد و هدف اصلی از توسعهی این API شرکتهایی هستند که نیاز به فضای ذخیرهسازی ابری و راهکارهای محاسبات ابری دارند. البته پس از مدتی این تکنولوژی جدید در دسترس کاربران عادی نیز قرار خواهد گرفت.
نظر شما در این مورد چیست؟