توصیف عکس برای افراد نابینا؛ گوگل سرویس TalkBack را به هوش مصنوعی مجهز کرد
سرویس TalkBack گوگل ابزاری برای تسهیل استفاده از سیستمعامل اندروید برای افراد توانیاب محسوب میشود. این سرویس قرار است که در ترکیب با جمنای، از توانمندیهای سرویس هوش مصنوعی گوگل برای تولید توضیحات شنیداری از اشیاء، بهافراد نابینا و کمبینا کمک کند.
اهالی مانتینویو در مراسم Google I/O اعلام کردند که سرویس TalkBack در بهروزرسانی جدیدی از مدل زبانی Gemini Nano برای ایجاد متون توضیحی از هر شیء داخل نمایشگر دستگاه اندرویدی بهرهمند خواهد شد که افراد نابینا نمیتوانند آن را مشاهده کنند.
با فعالشدن TalkBack، جمنای تصاویر را بررسی و مشخصات و ویژگیهای هرگونه شیء موجود داخل عکس را استخراج میکند و بهصورت صوتی آن عکس را توضیح میدهد. هوش مصنوعی بهکاررفته در TalkBack برای پردازش تصاویر به اتصال اینترنت نیازی ندارد و براساس پارامترهای پردازشی مبتنیبر دستگاه کار خواهد کرد.
بهعنوان نمونهای از کارکردهای نسخهی جدید TalkBack، تصویری از یک لباس بهنمایش درآمد. جمنای این تصویر را با عبارت «نمای نزدیکی از لباسی سیاه و سفید کوتاه با یقه و آستین بلند که روبان بزرگی دور کمر آن بسته شده» توصیف کرد.
بهگفتهی گوگل، کاربران TalkBack روزانه با حدود ۹۰ تصویر بدون زیرنویس یا همان Alt Text مواجه میشوند. با استفاده از مدل زبانی جمنای، تاکبک خواهد توانست توضیحاتی دربارهی محتوا ارائه دهد و نیاز به واردکردن دستی این متون توضیحی را از بین ببرد. این بهروزرسانی در اواخر سال جاری برای اندروید منتشر خواهد شد.
نظرات