فناوری بینایی ماشین مایکروسافت قادر است تصاویر را با توضیحات همراه کند
فناوری بینایی ماشین مایکروسافت قادر است با شناسایی اجزای تصویر، توضیحاتی را نیز روی تصویر به آن اضافه کند. شاید این موضوع از نظر ما انسانها چندان جالب به نظر نرسد، اما این قابلیت را باید بهعنوان یک توانایی و ویژگی بسیار خوب برای هوش مصنوعی در نظر داشت. ضمنا قابلیت فناوری مایکروسافت نشان از پتانسیل بالای شبکههای عصبی و سایر روشهای کامپیوتری دارد که درصدد مدلسازی الگوی کار مغز انسان هستند. فناوری مایکروسافت ابتدا اجزای تصویر را تشخیص داده و توضیحاتی را در خصوص هر یک از اجزا ثبت میکند. برای مثال همانطور که در تصویر فوق مشاهده میکنید این فناوری با تشخیص المانهای موجود در تصویر، جملاتی نظیر «دوربین بنفش به همراه آن شخ، آن خانم دوربین را در ازدحام جمعیت در دست گرفته و خانم گربه به همراه دارد» را ارائه میدهد. البته همانطور که میبینید این سیستم گربه را به اشتباه تشخیص داده است. این سیستم جملهی دوم را که حاکی از در دست گرفتن دوربین توسط خانم موجود در تصویر است، به عنوان تعریف اصلی تصویر ارائه میدهد.
مارگارت میشل، یکی از محققان مایکروسافت در زمینهی تحقیقات زبانهای طبیعی در این خصوص میگوید:
ما در پی آن هستیم تا بینایی را به زبان متصل کنیم، چراکه هدف نهایی ما ایجاد ابزارهای مبتنی بر هوش مصنوعی است.
این سیستم نهایتا میتواند بهعنوان سیستم بینایی ماشین با کورتانا ترکیب شود. تصور کنید که کورتانا میتواند از طریق دوربین موجود در گجتهای موبایل، محیط پیرامون را دیده و به کاربران یاری دهد.