چگونه گوگل درصدد گسترش استفاده از سیستم هوش مصنوعی خود همچون اندروید است؟
هوش مصنوعی و فناوریهای جدید هوشمند برای محاسبات از جملهی حوزههایی است که کمپانیهای پیشرو در درهی سیلیکون، فعالیتهای گستردهای را در این حوزه انجام میدهند. گوگل نیز از این قاعده مستثنی نبوده و در همین راستا در هفتهای که گذشت، پلتفرم TensorFlow را که مبتنی بر یادگیری ماشین است، بصورت متنباز در اختیار تمام علاقمندان به کار با این پلتفرم قرار داد. از این پس هر کاربر علاقمندی که به اتصال اینترنت و رایانه دسترسی داشته باشد میتواند از وجود یک سیستم بسیار قوی که از الگوریتمهای متعدد یادگیری ماشین بهرهمند است، به راحتی استفاده کند. گوگل برای تقویت بیش از پیش این سیستم و همچنین استفاده از امکانات و قابلیتهای آن که روز به روز بر آنها اضافه خواهد شد، بیش از ۵۰ سرویس خود را مبتنی بر این سیستم قرار داده است. یادگیری ماشین از شبکههای عصبی عمیق استفاده میکنند. این سیستم هم اکنون در کابردهای مختلفی برای گوگل انجام وظیفه میکنند که از جملهی آنها میتوان به شناسایی تصاویر در سرویس Photos تا جستجوی اطلاعات در موتور جستجوی این کمپانی اشاره کرد. گوگل را دیگر باید یک کمپانی خواند که سرویسهای خود را مبتنی بر یادگیری ماشین ارائه میکند. گوگل پس از توسعهی سیستم یادگیری ماشین خود و استفادهی عملی از آن در سرویسهایش، این سیستم را بصورت عمومی در اختیار علاقمندان قرار داده تا بیش از پیش به توسعهی آن شتاب بخشند.
TensorFlow چیست؟ نگاهی به سیستم یادگیری ماشین گوگل که غول جستجو در پی همه گیر کردن آن است
تعریف سادهی تانسورفلاو در درک دادههای دریافتی و استفاده از آنها در زمان تصمیمگیری است
تانسورفلاو را باید کتابخانهای از فایلها خواند که این امکان را در اختیار محققان و دانشمندان در حوزهی علوم کامپیوتر قرار میدهد تا سیستمهایی را برای تجزیه و درک اطلاعات طراحی کنند. این سیستمها قادرند با استفاده از کتابخانهی موجود، دادههایی نظیر تصاویر و صدا را تجزیه کرده و آنها را معنی کنند؛ این دادهها زمانی مورد استفاده قرار خواهند گرفت که رایانه بخواهد در زمینهی خاصی تصمیم بگیرد. این تعریف چند خطی، تشریح سادهای از عملکرد یک سیستم مبتنی بر یادگیری ماشین بود. در واقع اصل و بنیان یادگیری ماشین بر همین اصل استوار شده است: درک دادههای دریافتی و استفاده از آنها در زمان تصمیمگیری. یادگیری ماشین تلاشی است که در نتیجهی آن رایانهها هوشمندتر از پیش میشوند. در واقع هوشمندسازی رایانهها تعریفی گسترده و غیرشفاف از مفهومی است که در مورد هوش مصنوعی میدانیم. تانسور فلاو نیز با توجه به قابلیتهایی نظیر دقت بالا و سرعت پردازش بالای اطلاعات، یک ابزار بسیار پیچیده به شمار میرود و به نوعی میتوان آن را یکی از ابزارهای تعریف شده در حوزهی هوش مصنوعی خواند.
در صورتی که بخواهیم کمی تخصصیتر به فرآیند پردازش اطلاعات در تانسورفلاو نگاه کنیم، باید این سیستم را مبتنی بر گرافهای جریان داده تعریف کنیم. در این سیستم، دادهها از ابعاد مختلفی مورد بررسی قرار میگیرند. به بیان بهتر دادههای وارد شده به سیستم از نظر داشتن مقادیر ارزشی گوناگونی در نظر گرفته شده و از چندین محاسبات ریاضی عبور میکنند. هر یک از این دادههای چند بعدی تانسور خوانده شده و معادلات محاسباتی اعمال شده روی آنها نیز به عنوان نودها در نظر گرفته میشوند. تغییرات دادهها بین نودهای مختلف، روابط در این سیستم را نشان میدهد. با توجه به اینکه جریان گراف تانسورها رابطه و ماهیت سیستمها را تعریف میکند، از اینرو گوگل این سیستم را TensorFlaw نام گذاری کرده است.
زیر پوست تانسور فلاو، منافع بلند مدتی برای گوگل پیشبینی شده که در واقع گسترش حوزهی فعالیت این سیستم و گسترش نفوذ گوگل در حوزهی هوش مصنوعی است
متنباز کردن این سیستم امکان بهرهگیری از قابلیتهای یک سیستم بسیار پیشرفته را در اختیار محققان، دانشمندان و حتی افرادی که به تازگی فارغ التحصیل شده یا همچنان در حال تحصیل هستند، قرار میدهد. اما تاثیر اصلی این سیستم در پتانسیل آن برای استفاده توسط سایر کمپانیهایی که در زمینهی هوش مصنوعی و سیستمهای یادگیری ماشین فعالیت میکنند، نهفته است. به بیان بهتر تمام کمپانیهای فعال در این حوزه که شامل استارتآپهای کوچک تا کمپانیهای چند میلیارد دلاری میشوند، میتوانند از این سیستم در جهت اهداف خود استفاده کنند. تانسور فلاو این قابلیت را در اختیار تمام کمپانیها قرار میدهد تا از قابلیتهای آن در جهت نیازهای کمپانیهای مورد نظر استفاده شود که این اهداف حتی میتواند در جهت عکس منافع گوگل نیز باشد. اما زیر پوست این سیستم، منافع بلند مدتی برای گوگل پیشبینی شده که در واقع گسترش حوزهی فعالیت سیستم تانسور فلاو و گسترش نفوذ گوگل در حوزهی هوش مصنوعی است.
پروفسور کریستوفر مننیگ (Christopher Manning)، استاد دانشگاه استنفورد است که از سه ماه پیش شانس استفاده از تانسور فلاو را داشته است. وی به همراه دانشجویانش در سه ماه گذشته با این سیستم کار کردهاند. تنها پس از گذشت چند ماه از کار با این سیستم، منینگ تصمیم گرفت تا از این سیستم در برنامهی درسی خود استفاده کند.
منینگ علاوه بر اندروید، پلتفرم تانسورفلاو را به سرویس جیمیل گوگل نیز تشبیه کرده است. به اعتقاد وی، با وجود اینکه سرویسهای ایمیل متعددی در اینترنت وجود دارد، اما بسیاری استفاده از این سرویس ایمیل را به موجب بهرهگیری از رابط کاربری ساده و کابردهای گستردهی آن در سرویسهای مختلف، ترجیح میدهند.
منینگ در این خصوص چنین اظهار نظر کرده است:
پیش از اینکه گوگل تانسور فلاو را بصورت متنباز در اختیار همگان قرار دهد، کتابخانههای مبتنی بر یادگیری ماشین دیگری نیز وجود داشتند. اما نکتهای که در مورد این کتابخانهها وجود دارد، توسعهی آن توسط حداکثر تعداد معدودی دانشگاه و چند متخصص یا دانشجویی است که روی آن کار کردهاند.
هرچند سیستمهای دیگری نظیر Torch یا Theano وجود دارند که توسط گروه کوچکی از متخصصان بروز شده و روز به روز قدرتمندتر از پیش میشوند، اما نمیتوان گستردگی و قابلیتهای ارائه شده توسط این سیستمها را با سرعت و قدرت آنچه که متخصصان گوگل توسعه دادهاند، مقایسه کرد. منینگ به این موضوع اشاره میکند که تانسور فلاو را باید یک هدیهی بسیار ارزشمند برای جامعهای از متخصصان و کمپانیها خواند که در این حوزه به فعالیت میپردازند. به گفتهی وی بهینهسازی شبکههای عصبی امری طاقت فرسا است؛ از اینرو آنچه گوگل بصورت متنباز دراختیار همگان قرار داده، بسیار ارزشمند است.
هدف از توسعهی تانسور فلاو، توسعهی نظریههای متخصصین از سطح ایده و پیادهسازی این ایدهها در سطحی است که بتوان از آنها به عنوان یک محصول استفاده کرد.
جف دین، از جملهی دو مهندس ردهی بالا در گوگل است که بخش اعظمی از توسعهی تانسور فلاو را بر عهده داشتهاند. فرد دیگری که نقش پررنگی در توسعهی این سیستم دارد، راجات مونگا است. جف دین در خصوص میزان تاثیرگذاری و استفاده از این سیستم در جامعهی فعالین حوزهی هوش مصنوعی و یادگیری ماشین، با احتیاط بیشتری سخن میگوید. وی به این نکته اشاره میکند که گوگل تانسور فلاو را در کاربردهایی که خود از آن استفاده میکند، بسیار کاربردی و مثمر ثمر یافته است، حال آنکه این سیستم، آزمایش واقعی خود را زمانی پس خواهد داد که عموم متخصصان در کاربردهای مختلف بتوانند قابلیتهای آن را مورد استفاده قرار داده و تانسور فلاو را یک سیستم کاربردی بدانند. جف دین، هدف از توسعهی تانسور فلاو را توسعهی نظریههای متخصصین از سطح ایده و پیادهسازی آنها در سطحی میخواند که بتوان از آنها به عنوان یک محصول استفاده کرد.
دین در این خصوص چنین اظهار نظر کرده است:
ما در درجهی اول امیدواریم تا شتاب تحقیقات و پیادهسازی سیستمها در حوزهی یادگیری ماشین را بیش از پیش افزایش دهیم. جامعهی فعال در حوزهی یادگیری ماشین از نظر ارائهی ایدههای کاربردی بسیار فعال هستند؛ اما فعالیتهای انجام شده در مورد پیادهسازی و کدنویسی در این حوزه به اندازهی ایدههای ارائه شده خوب و کاربردی نیست.
هرچند متنباز کردن این سیستم توسط گوگل هدیهی بسیار بزرگی است، اما ایدهآلترین سناریو برای این سیستم زمانی اتفاق میافتد که جامعهی فعال در یادگیری ماشین نیز دستاوردهای خود را در این حوزه با دیگران و گوگل به اشتراک بگذارند.
تانسور فلاو را باید یک سیستم کامل برای محققان معرفی کرد؛ چراکه در پکیج ارائه شده توسط گوگل میتوان هر ابزار و امکاناتی را به منظور تحقیقات در حوزهی هوش مصنوعی یافت. تانسور فلاو یک سیستم کامل و در واقع یک کتابخانهی مستقل است که با ابزارهای کاربردی و گواهی آپاچی ۲.۰ نیز همراه شده است؛ از اینرو میتوان از این سیستم در کاربردهای تجاری نیز استفاده کرد. تانسور فلاو را میتوان در رایانهی رومیزی و لپتاپ کامپایل کرده یا از آن روی گوشیهای هوشمند اندرویدی استفاده کرد. گوگل این سیستم را همراه با مستندات و فایلهای آموزشی متعددی همراه کرده تا کاربران بتوانند از آن استفاده کنند.
منینگ با اشاره به قابلیت اجرای الگوریتمهای یادگیری ماشین روی گوشیهای هوشمند اندرویدی، این ویژگی را برتری و وجه تمایز تانسور فلاو با سایر سیستمهای مبتنی بر یادگیری ماشین متنباز عنوان کرده است.
برای افرادی که میخواهند ا زاین سیستم استفاده کنند، گوگل نسخهای را تدارک دیده که میتوان از آن بهره گرفت. همچنین API تانسور فلاو نیز در اختیار برنامهنویسان قرار دارد تا بتوانند با بهرهگیری از آن مدلهای خود را در تانسور فلاو کنترل و مدیریت کنند.همانطور که اشاره کردیم، گوگل در بیش از ۵۰ سرویس خود از این سیستم استفاده میکند.
در داخل آزمایشگاه هوش مصنوعی گوگل چه میگذرد؟
متنباز کردن این پلتفرم توسط گوگل به این معنا است که همهی افراد فعال در این حوزه از شانس برابری برای بهرهگیری از قابلیتهای تانسور فلاو بهره میبرند. در واقع با نگاهی به این پلتفرم میتوان روند توسعه و پیشرفت سرویسهای گوگل مبتنی بر سیستم یادگیری ماشین را به روشنی دید.
گوگل در سه سال اخیر تمام زمان خود را برای ساخت این پلتفرم گسترده برای استفاده در حوزهی هوش مصنوعی صرف کرده و هم اکنون شاهد عرضهی جهانی و در اختیار گذاردن آن برای تمام علاقمندان و فعالان در این حوزه هستیم. البته باید به این نکته اشاره کرد که گوگل ترجیح میدهد تا این سیستم با عنوان هوش ماشین شناخته شود. گوگل استفاده از واژهی هوش مصنوعی را به این دلیل که این واژه دربردارندهی مفاهیم کلی بسیاری است، مناسب سیستمی که توسعه داده نمیداند. این کمپانی در پی آن است تا یک هوش واقعی را ایجاد کند که این هوش درماشینها مورد استفاده قرار خواهد گرفت.
مهندسان گوگل در این کمپانی در صورتی که بخواهند تا با سیستمهای مبتنی بر شبکههای عصبی کار کنند، میتوانند این سیستم را به طور کامل برای استفاده در اپلیکیشن یا سرویس خود و به منظور همخوانی با اهداف تعیین شده برای سرویس مدنظرشان از نو بسازند. این سیستم به اندازهای پویا است که ۱۰۰ تیم در داخل خود گوگل با استفاده از آن تکنیکهای مبتنی بر یادگیری ماشین متفاوتی را توسعه دادهاند.
ساندار پیچای، مدیرعامل گوگل در جریان کنفرانس مربوط به ارائهی گزارش مالی گوگل در اکتبر ۲۰۱۵ در این رابطه چنین اظهار نظر کرده است:
یادگیری ماشین هسته و مسیر انقلاب در سرویسهای کنونی ما است که ما را به تجدید نظر در مورد کارکرد سیستم ها واداشته است. ما در حال اعمال و استفاده از این سیستم در کل محصولات و سرویسهایی که ارائه میدهیم، هستیم. برای مثال میتوان به سرویس جستجو، یوتیوب و گوگل پلی اشاره کرد. ما هنوز در اول مسیر هستیم و به مرور و بصورت اصولی این سیستم بنیادی را در کل سرویسهای خود به کار خواهیم بست.
در گوگل همه چیز مبتنی بر هوش مصنوعی بوده و هوش مصنوعی همه چیز است
به سختی میتوان نموداری دقیق و روشن از میزان بکارگیری هوش ماشین در گوگل تعریف کرد؛ چراکه تحقیقات در این مورد بسیار گسترده بوده و این سیستم در گوگل همواره در حال تغییر است. همچنین باید به این نکته اشاره کرد که تیمهای مختلف فعال در گوگل همگی به نوعی در این خصوص درگیر بوده و در حال استفاده از هوش ماشین در سرویس ارائه شده توسط گوگل هستند.
جان جیاناندرا، قائم مقام مهندسی اینترنت، سیستم در حال توسعه توسط گوگل را Embedded Model خوانده است. هرچند گوگل سیستم هوش ماشین خود را بصورت متنباز در اختیار همگان قرار داده، اما فرآیند توسعهی سیستم مورد نظر در تیمهای مختلف گوگل بصورت بسیار سری انجام شده و کوچکترین اطلاعاتی در این خصوص به بیرون درز نمیکند.
در مقر اصلی گوگل که بیش از ۳۲۵٫۰۰۰ متر مربع وسعت دارد، تمام تیمها برای استفاده از این سیستم هوش ماشین گوگل درگیر هستند
در مقر اصلی گوگل که بیش از ۳۲۵٫۰۰۰ متر مربع وسعت دارد، تمام تیمها برای استفاده از این سیستم هوش ماشین گوگل درگیر هستند. هر یک از متخصصانی که در این کمپانی به فعالیت میپردازد از این سیستم در راستای اهداف تیمی که در آن عضو است، استفاده میکند. علاوه بر این افراد که هر یک در تیمهای خود به توسعهی سرویسهای مورد نظر میپردازند، همواره متخصصانی نیز وجود دارند که وظیفهی آنها برطرف کردن مشکلات اصلی موجود در سیستم هوش ماشین توسعه داده شده توسط گوگل است. نتیجهی این کار مستقیما روی عملکرد تمام سرویسهای گوگل که از این سیستم هوشمند استفاده می کنند تاثیرگذار است. از جملهی این اپلیکیشنهای اصلی میتوان به Photos یا جستجوی صوتی گوگل و مهمتر از همه جستجوی متنی گوگل اشاره کرد. البته در این بین شماری از پروژهها نیز وجود دارند که محصولی برگرفته از آن تاکنون روانهی بازار نشده است. برای مثال میتوان به سیستم دستخط کاربران اشاره کرد.
جیاناندرا در این خصوص چنین اظهار نظر کرده است:
ما از جملهی کمپانیهایی هستیم که دوست داریم بدانیم مردم با استفاده از چه الگویی مینویسند و هر شخص براساس چه معیارهایی دست خط خاصی دارد. همین موضوع از جملهی حوزههایی است که گوگل روی آن سرمایهگذاری میکند؛ هرچند تاکنون محصولی مستقل برگرفته از آن در اختیار کاربران قرار نگرفته است.
البته باید به این موضوع اشاره کرد که گستردگی اپلیکیشنها و سرویسهای ارائه شده توسط گوگل این امکان را فراهم میکند تا بالاخره هر یک از پروژهها نهایتا در صورت عدم عرضه بصورت محصول مستقل، با اپلیکیشن یا سرویس دیگری عرضه شود. در مورد پروژهی شناسایی دست خط نیز گوگل ترجیح داده تا از این ویژگی در سرویس Google Keep استفاده کند.
معمولا روال کار به این صورت است که با پایان کار تحقیقات و رسیدن به دستاوردهای تحقیقاتی در یک موضوع خاص، محققان یافتههای خود را در اختیار تیمهای توسعه قرار میدهند تا اعضای این تیم از فناوریهای جدید در محصولات نهایی استفاده کنند. برای مثال میتوان به اپلیکیشن Photos و سرویس ترجمهی گوگل اشاره کرد.
در بخش تحقیقات نیز، گوگل افراد را براساس علایق به گروههای تحقیقاتی مختلفی تقسیم کرده است. برای مثال شماری از افراد در تیم تحقیقاتی بینایی ماشین، شماری در درک زبانها و شمار دیگری نیز در تیم شناسایی صوت فعالیت میکنند. این تیمها هر یک در حوزههای تعیین شده دستاوردهای جدید خود را در اختیار تیمهای توسعه قرار میدهند که وظیفهی آنها طراحی و توسعهی محصولات است.
جیاناندرا در مورد هدف گوگل از تیمهای تحقیقاتی چنین اظهار نظر کرده است:
گوگل در زمینههایی نظیر شناسایی صوت، ترجمهی زبانها و درک زبانهای مختلف درصدد بهرهگیری از بهترین سیستمهای ممکن است؛ از اینرو حوزههای مورد نظر را باید در زمرهی مواردی قرار داد که گوگل همواره روی آنها سرمایهگذاری میکند.
در گوگل بیش از ۱۰۰۰ متخصص در مورد کاربردهای هوش ماشین مشغول به انجام تحقیقات هستند
در گوگل بیش از ۱۰۰۰ متخصص در مورد کاربردهای هوش ماشین مشغول به انجام تحقیقات هستند. فرآیند کار روی پروژه و دستاوردهایی که تیم به آنها دست پیدا میکند، وضعیت را از کار کردن روی یک مفهوم نظری، به تلاش برای دست یافتن به یک کاربرد عملی و ارائهی سرویس تبدیل میکند. البته میزان سختی پروژههایی که توسط تیمهای مختلف انجام میشود، متفاوت است.
تغییرات در گوگل و ایجاد هلدینگ آلفابت نیز نتوانسته مواضع غول جستجو را در مورد هوش ماشین را تغییر دهد. هر چند تیم تحقیقاتی که روی پروژهی هوش ماشین کار میکند، همچنان زیر پرچم گوگل باقی میماند، اما مانعی برای همکاری با سایر بخشهای کمپانی نظیر آزمایشگاه گوگل ایکس یا بخش علوم وجود نخواهد داشت.
صدایی از آینده
جستجوی صوتی یکی از محصولات درخشان گوگل است که میتوان به جرات آیندهی درخشانی را برای آن پیشبینی کرد.یقینا تاکنون بارها با سیستم جستجوی صوتی گوگل روبرو شده یا از آن استفاده کردهاید. در صورتی که آشنایی چندانی با سیستم جستجوی صوتی گوگل ندارید، بهتر است در صورت استفاده از سیستم جستجوی گوگل، نگاهی به منتهی الیه سمت راست کادر جستجو داشته باشید تا آیکن میکروفون مربوط به جستجوی صوتی را مشاهده کنید. با کلیک روی این آیکن میکروفون و فشار دادن آن میتوان عبارت مورد نظر خود را که میخواهیم آن را جستحو کنیم، به زبان بیاوریم که در نتیجه گوگل با دریافت صدای شما و تلاش برای تفکیک و درک منظور، نتایج مرتبط را نمایش میدهد. آیکن میکروفون مورد نظر در اپلیکیشن جستجوی گوگل برای اندروید و آیفونهای اپل نیز قابل مشاهده است.
جستجوی صوتی گوگل به دومین مدخل برای دسترسی به مخزن دادههای گوگل تبدیل شده است
هرچند میتوان دستیار صوتی اپل یا همان سیری را به عنوان رقیبی برای سیستم صوتی گوگل در نظر گرفت، اما باید به این موضوع اشاره کرد که جستجوی صوتی گوگل به دومین مدخل برای دسترسی به مخزن دادههای گوگل تبدیل شده است. تیم توسعهدهندهی سیستم شناسایی زبانهای گوگل از این موضوع بسیار خرسند است؛ چراکه جستجوی صوتی گوگل رفته رفته در حال افزایش محبوبیت خود بوده و پس از جستجوی متنی به دومین راه برای کند و کاو اطلاعات از طریق گوگل تبدیل شده است.
البته باید به این نکته اشاره کرد که گوگل در گزارشهای خود اشارهای به میزان جستجوهای انجام شده از طریق صوت نکرده است. البته این کمپانی به این موضوع اشاره کرد که میزان جستجوهای انجام شده با استفاده از گجتهای موبایل نسبت به جستجوهای انجام شده از طریق رایانههای دسکتاپ بسیار افزایش یافته و کفهی ترازو در آمریکا به سمت جستجوهای موبایل سنگینتر شده است. به همین نسبت در طول سال گذشتهی میلادی میزان جستجوهای صوتی انجام شده در آمریکا که از طریق تبلت و گوشی هوشمند انجام شده، نشان از افزایشی بیش از ۵۰ درصد دارد. یکی از چالشهای پیش روی گوگل، آشنا کردن و ترغیب کاربران برای استفاده از سیستم جستجوی صوتی گوگل است.
فرانسیز بوفیز، محقق ارشد گوگل در زمینهی توسعهی موتور شناسایی صوت گوگل که در سیستم جستجوی این کمپانی مورد استفاده قرار میگیرد، فعالیت میکند. وی دلیل افزایش استفاده از سیستم صوتی جستجوی گوگل را بهبود عملکرد این سیستم در مقایسه با روزهای اول فعالیت این سیستم میداند. وی در این خصوص چنین اظهار نظر کرده است:
زمانی که ما فعالیتهای خود را برای توسعهی سیستمهای شناسایی صوت آغاز کردیم، شماری از کاربران از این سیستم استفاده میکردند، اما در حالت کلی اغلب کاربران صبر کرده بودند تا پس از بهبود عملکرد این سیستم به سراغ آن بیایند. امروزه بخش بزرگی از کاربران به سیستم جستجوی صوتی گوگل اعتماد کرده و از آن استفاده میکنند.
بوفیز به این موضوع اشاره کرده که گوگل موتور قبلی مورد استفاده برای شناسایی اصوات را کنار گذاشته و از سیستم جدید مبتنی بر شبکههای عصبی برای شناسایی صدای کاربران و تشخیص دستورات صوتی استفاده میکند.
برای اینکه یک ماشین یا به بیان بهتر رایانه بتواند صدای انسان را درک کند، ابتدا نیاز است تا این سیستم ابتدا آوای کلمات و عبارات را یاد بگیرد. یادگیری صدای لغات و عبارات در هر زبان به معنای گوش دادن به حجم زیادی از فایلهای صوتی است. تمام این فایلهای صوتی یکبار توسط الگوریتمهای خاصی مورد پردازش قرار میگیرند که نتیجهی آن ایجاد گرافهایی است که طی آن مشخص میشود چه صدایی به کدام لغت یا عبارت نزدیک تر است. زمانی که یک فایل صوتی در اختیار سیستم قرار میگیرد، موتور مورد نظر شکل موج فایل صوتی دریافت شده را از گرافی که تشکیل داده عبور میدهد تا بتواند معنای عبارات مورد استفاده در فایل صوتی را درک کند.
بوفیز در مورد عملکرد گراف تشکیل شده این چنین اظهار نظر میکند:
زمانی که فایل صوتی دریافت شده توسط گراف مورد نظر بررسی شد، فایل صوتی مورد نظر در خروجی به رشتهای از لغات تبدیل میشود و سیستم این رشته را به عنوان خروجی عرضه میکند.
عملکرد سیستم شناسایی صدا به فایلهای صوتی که در ابتدا برای آموزش سیستم مورد استفاده قرار میگیرند، وابسته است
باید به این نکته توجه کرد که عملکرد این سیستم به فایلهای صوتی که در ابتدا برای آموزش سیستم مورد استفاده قرار میگیرند، وابسته است. این دادههای صوتی شامل بیش از میلیونهای فایل صوتی است که توسط کاربران گوگل در زمان جستجوی از طریق صدا وارد سیستم شده است. زمانی که هر کاربر اقدام به انجام یک جستجوی صوتی میکند، صدای ضبط شده در سرورهای گوگل آپلود میشود. در صورتی که اجازه از سوی کاربر برای بهرهگیری از این صدا صادر شده باشد، عول جستجو از این فایل صوتی در بانک اطلاعاتی فایلهای صوتی خود استفاده میکند تا هوش ماشین خود را آموزش داده و تقویت کند.
پیش از آنکه این فایل صوتی توسط سیستم مورد استفاده قرار گیرد، باید مراحلی طی شود. ابتدا تمام اطلاعاتی که از شما روی این فایل صوتی باقی مانده، پاکسازی میشود، به بیان بهتر تمام اطلاعاتی که فایل صوتی را به کاربر متصل میکند، از آن پاک میشود. این اطلاعات میتواند شامل اطلاعات مکانی، اطلاعات حساب کاربری و حتی زمان وارد شدن صدا در سیستم باشد که به نوعی با کنار هم قرار دادن آن کاربر شناسایی میشود. این فایل صوتی در مرحلهی بعد در اختیار یک عامل انسانی قرار میگیرد تا فایل صوتی مورد نظر را گوش کرده، اطلاعات مربوط به آن را بصورت متنی استخراج و آن را به تفکیک لغات و در قالب جملهای که کاربر وارد سیستم کرده، بنویسد. علت اینکه در این مرحله از یک عامل انسانی استفاده شده، نیاز به یک منبع معتمد است تا اطلاعات را به درستی برای آموزش در اختیار سیستم قرار دهد. هر یک از فایلهای صوتی وارد شده در سیستم باید یک متادیتا داشته باشند. یک فایل صوتی نامناسب نمونهای است که متادیتای مناسبی با آن همراه نشده باشد. در برخی موارد محققان به عمد نویزهایی را روی برخی فایلهای صوتی قرار میدهند تا از این طریق سیستم قادر باشد لغات مختلف را در شرایط متفاوتی که کیفیت فایل صوتی برابر نیست، شناسایی کند.
بوفیز روی این نکته تاکید میکند که شرکت در این آزمایش کاملا اختیاری است و کاربرانی که تمایلی به نگهداری و استفاده از صدای آنها در سیستم نداشته باشند، میتوانند از این کار جلوگیری کنند.
دو سال پیش نرخ خطای سیستم تشخیص صدا بیش از ۲۵ درصد بود؛ حال آنکه خطای سیستم در حال حاضر به کمتر از ۸ درصد رسیده است.
براساس اطلاعات ارائه شده توسط گوگل، استفاده از این سیستم باعث شده تا میزان خطا در سیستم شناسایی صدای کاربران کاهش بسیار زیادی را تجربه کند. اطلاعات ارائه شده نشان از این دارد که دو سال پیش نرخ خطای سیستم بیش از ۲۵ درصد بود؛ حال آنکه خطای سیستم در حال حاضر به کمتر از ۸ درصد رسیده است.
اما سوالی که شاید به ذهن شما رسیده، روشی است که گوگل در صورت عدم امکان دسترسی به دادههای کاربران برای آموزش سیستم مورد استفاده قرار خواهد داد؟
اینباکس هوشمند
همانطور که در زومیت خواندید، گوگل در هفتههای اخیر سیستم هوشمند خود را با سرویس ایمیل خود و اپلیکیشن اینباکس ترکیب کرده است. در صورتی که از اپلیکیشن اینباکس روی گوشیهوشمند یا تبلت خود استفاده کنید، عملکرد سیستم تانسور فلاو را مشاهده خواهید کرد. براساس اطلاعات ارائه شده، قابلیت جدید این امکان را در اختیار کاربران قرار میدهد تا در صورتی که فرصت کافی برای پاسخ گویی به ایمیل نداشته باشند، از پاسخهای پیشنهادی سیستم استفاده کنند. در این حالت سیستم هوشمند با مطالعهی متن ایمیل کاربر سه پاسخ را به وی نمایش خواهد داد تا برای فرستندهی ایمیل ارسال کند. در صورتی که یکی از پاسخها به دفعات از سوی کاربر مورد استفاده قرار نگیرد، سیستم هوشمند گوگل به این نتیجه خواهد رسید که کاربر علاقهای به پاسخ مورد نظر نداشته و از آن پس این پاسخ را پیشنهاد نخواهد داد. گوگل این ویژگی جدید در اینباکس را با نام Smart Reply معرفی کرده است.
آلکس گاولی، مدیر محصول جیمیل در مورد این قابلیت چنین اظهار نظر کرده است:
ما به مرور قدرت شبکههای عصبی توسعه یافته توسط تیم تحقیقاتی گوگل را مشاهده کردیم. مشاهده ی قابلیتهای این سیستم هوشمند ما را بر آن داشت تا از این قابلیتها در مواردی بیش از درک و سازماندهی استفاده کنیم. ایدهی استفاده از این سیستم برای درک و نگارش پاسخ برای ایمیلها از همین موضوع نشات گرفته است.
متخصصان گوگل به این موضوع اشاره میکنند که هیچ یک از ایمیلها توسط افراد در گوگل خوانده نمیشوند و همهی فرآیند بر عهدهی سیستم است. همچنین سیستم براساس انتخاب کاربر در مورد استفاده از دادهها به منظور یادگیری، از متن ایمیل برای آموزش شبکهی عصبی استفاده میکند. براساس دادههای وارد شده و آموزش سیستم، متخصصان بدون نیاز به خواندن ایمیلهای کاربران سوالاتی را از سیستم میپرسند و براساس پاسخهای دریافت شده به این نتیجه میرسند که کدام قسمت از سیستم نیاز به بهبود دارد.
با نگاهی به اسمارت ریپلای میتوان به وضوح دید که گوگل چگونه این سیستم را در محصولات خود مورد استفاده قرار میدهد. تیم اینباکس سیستم هوشمند را بصورت مستقل در محصول خود مورد استفاده قرار داده است. در مرحلهی اول این سیستم بصورت داخلی مورد استفاده قرار گرفته و ماشین هوشمند بصورت آزمایشی در معرض اطلاعاتی قرار گرفته تا صحت عملکرد آن سنجیده شود. این فرایند را در اصطلاح DogDooding می نامند. در این مرحله کل تیم اینباکس روی این سیستم کار کرده و باگهای حاصل را یادداشت میکنند که نتیجهی آن بهبود عملکرد سیستم در این مورد خاص است. زمانی که سیستم مورد نظر به اندازهای بهبود یافت که اشتباهات آن به میزان قابل قبول رسید، این قابلیت بصورت عمومی در اختیار کاربران قرار میگیرد.
گوگل هدف از راهاندازی تمام سیستمهای مبتنی بر ماشین را تسهیل کار کاربران خوانده است. از جملهی محصولات دیگری که از همین سیستم هوشمند استفاده میکنند باید به گوگل ناو اشاره کرد. گوگل اعلام کرده که نتیجهی بهرهگیری از سیستمهای هوشمند در محصولات این کمپانی، بر عهده گرفتن اموری است که برای کاربران یا عوامل انسانی امری سخت، اما برای ماشینها امری بسیار ساده و سهل است. آپارنا چناپراگادا، مدیر گوگل ناو در مورد عملکرد سیستمهای هوشمند و علت توسعهی گوگل ناو میگوید:
جوانب استفاده از سیستمهای هوشمند در پلتفرمهای مختلف باید در نظر گرفته شود؛ چراکه این سیستمها در جهت تکامل و قرار گرفتن در کنار مغز انسان توسعه مییابند تا روند زندگی انسانها تسهیل کنند.
هدف غول جستجو از توسعهی سیستم هوشمند و استفاده از آن در سرویسهای خود که برای مثال میتوان به گوگل ناو اشاره کرد، ایجاد یک دستیار صوتی هوشمند واقعی و کارا است. این دستیار صوتی هوشمند باید بسیار باهوش باشد . حتی میتوان این دستیار صوتی را به عنوان بخشی از مغز کاربران در نظر گرفت که پس از خرید گوشی یا استفاده از گجتهای هوشمند به آنها پیوسته است.
برای اینکه سیستم به چنین قابلیتی رسیده و بتواند شما را در تمام امور یاری کند باید اطلاعاتی را در موارد مختلف دریافت کند. برای مثال سیستم باید در مورد جستجوهای انجام شده توسط کاربر، موزیکهایی که کاربر گوش میدهد و مکانهایی که میرود اطلاعاتی را در اختیار داشته باشد.
زمانی که اطلاعات دریافت شده از کاربران مختلف با اطلاعات موجود ترکیب شده و در اختیار KnowledgeGraph این کمپانی قرار بگیرد، کاربران به منبع بسیار آگاهی دسترسی خواهند داشت که میتواند آنها در موراد بسیاری یاری دهد. برای مثال در صورتی که شما مکان دقیق فرودگاه شهری را که در آن قرار گرفتهاید، ندانید، گوشی هوشمندتان از آن اطلاع خواهد داشت و میتواند شما را به راحتی به سمت فرودگاه هدایت کند.
یکی دیگر از مواردی که اطلاعات کاربران را برای استفادهی عموم ارزشمند میکند، بهرهگیری از اطلاعات ترافیکی اشتراک گذاشته توسط کاربران است. برای مثال در صورتی که اطلاعات مربوط به موقعیت مکانی کاربران با گوگل به اشتراک گذاشته شوند، گوگل میتواند با بهرهگیری از این اطلاعات به سرعت حرکت کاربران مختلف در مسیرها پی برده و از اینرو تشخیص دهد که آیا در بزرگراه خاصی ترافیک سنگین وجود دارد یا خیر. این موضوع در مورد تشخیص شلوغ یا خلوت بودن یک رستوران یا کافی شاپ نیز صادق است.
گوگل ناو را باید تمثیلی گویا از مسیر طی شده توسط گوگل برای توسعهی سیستم هوشمند این کمپانی بدانیم.
سازماندهی دادههای جهان
در بخش قبلی به این موضوع اشاره کردیم که دستیار صوتی گوگل یا همان Google Now از KnowledgeGraph استفاده میکند. در ادامه به بررسی این مفهوم و به تشریح آن خواهیم پرداخت.
جان جیاناندار، مدیر موتور جستجوی گوگل در سال ۲۰۱۰ به غول جستجو پیوسته است. وی پیش از پیوستن به گوگل در کمپانی Metaweb که در سال ۲۰۰۴ میلادی تاسیس شده بود، مشغول به کار بود. متاوب یک پایگاه دادهی متنباز از اطلاعات جهانی را جمع آوری میکرد. در واقع کمپانی مورد نظر اطلاعاتی را در حوزههای مختلف جمع آوری کرده و توضیحات متنی را به آنها مرتبط میکرد. تقریبا این سیستم مشابه سیستم جستجویی بود که گوگل راهاندازی کرده بود که همه چیز را در خود جای داده بود. این کمپانی توسط گوگل تصاحب شد و در نتیجه کارکنان آن از جمله خود جیاناندار به این کمپانی پیوستند. وی پس از پیوستن به گوگل نیز روی این پروژه مشغول به کار بود.
تمام پروژهای که متاوب توسعه داده بود، بعدها در KnowledgeGraph یا همان گراف اطلاعات این کمپانی مورد استفاده قرار گرفته و از سال ۲۰۱۲ در سرویس جستجوی گوگل به کار رفت. نتیجهی بکارگیری گراف اطلاعات را میتوان همان پاپ آپهایی خواند که در صورت جستجوی عباراتی نظیر When was Mercedes Benz Founded میتوان دید. اگر این عبارت را در جستجوی گوگل تایپ کنید، عدد ۱۹۲۶ برای شما درون یک پاپ آپ نمایش داده میشود.
گوگل با استفاده از گراف اطلاعات نه تنها به مرتب کردن اطلاعات موجود در اینترنت کمک شایانی کرد، بلکه آن را در موتور جستجوی خود نیز مورد استفاده قرار داده و وجههای عملی به این ویژگی داده است. استفاده از گراف اطلاعات را باید اولین کاربری هوش مصنوعی در جستجوی گوگل و به طور کلی اولین کاربری هوش مصنوعی در سرویسهای گوگل بدانیم. پس از آن گوگل ۱۵ درصد از جستجوهای روزانه خود را به مدل هوش مصنوعی خود که RankBrain نام داشت، انتقال داد. این سیستم قادر بود تا سوالاتی را که سیستمهای قبلی مورد استفاده قادر به فهم آن نبودند، درک کرده و نتایج مرتبط را برای کاربران نمایش دهد.
هدف نهایی از بکارگیری سیستمهای مبتنی بر شبکههای عصبی ایجاد قابلیتی مشابه هوش انسان در هوش مصنوعی است. برای مثال سیستمهای کنونی برای ترجمهی یک متن از ترجمهی واژه به واژه در کنار بهرهگیری از گرامر به منظور ترجمهی صحیح استفاده میکنند؛ از اینرو نمیتوان برداشتی انسانی را در ترجمههای صورت گرفته توسط سیستمهای رایانهای دید. دانشمندان علت این موضوع را ضعف سختافزاری شبکههای عصبی مورد استفاده در مقایسه به هوش انسانی میدانند. در واقع حجم شبکههای عصبی توسعه یافته در سیستمهای هوشمند کنونی در مقایسه با مغز انسان بسیار ناچیز است و در نتیجه میزان اطلاعاتی که میتوان در مغز انسان ذخیره کرد بسیار گستردهتر از اطلاعاتی است که شبکههای عصبی کنونی قادر به ذخیرهی آن هستند.
بسیاری از متخصصان در حوزهی هوش مصنوعی پیشرفتهای صورت گرفته در پنج سال اخیر را بسیار بزرگ میخوانند و با رویکردی مثبت به آیندهی این حوزه از دانش رایانه مینگرند. باید دید که آیا در سالهای آینده سیستمهای هوشمندی مشابه هوش انسانی با قدرت درک و تجزیهی و تحلیل مسائل مختلف توسعه خواهند یافت یا خیر؟ آیا رویای انسان برای ساخت هوش مصنوعی که قادر باشد همچون انسان به تفکر پرداخته و بصورت مستقل در مورد مسائل مختلف تصمیمگیری کند، رنگ واقعیت به خود خواهد گرفت یا خیر؟ نظر شما در این خصوص چیست؟