دیجی کالا چگونه مدیریت بخش کامنت را به دست هوش مصنوعی سپرده است
اواخر آبانماه سال جاری دیجیکالا با انتشار خبری اعلام کرد که بخش اعظم مدیریت بخش کامنتها در این فروشگاه به هوش مصنوعی سپرده شده است. برای آگاهی از کم و کیف این سیستم به گفتوگو با مدیران دیجیکالا نشستیم. در این گفتوگو، وحید پولادی، مدیر بخش محتوای دیجیکالا و نوید شهدی، مدیر بخش هوش مصنوعی، به ارائه اطلاعاتی در رابطه با این سیستم پرداختند.
امیرحسن موسوی، مدیر روابط دیجیکالا، در ابتدای گفتوگو اعلام کرد که برای توسعهی این سیستم دو تیم محتوا و هوش مصنوعی درگیر بودهاند. البته به گفتهی موسوی، پیش از تشکیل تیم هوش مصنوعی، یکی از استارتاپهای حاضر در دیجیکالا نکست در این فرایند شرکت داشته که در ادامهی ماجرا با تشکیل تیم هوش مصنوعی دیجیکالا به مدیریت نوید شهدی، فرایند توسعه به تیم هوش مصنوعی دیجیکالا سپرده شده است.
- کامنت کاربران چه جایگاهی در ساختار محتوای دیجیکالا دارد؟
- وحید پولادی: فرایند مدیریت محتوا در دیجیکالا پس از گذشت ۱۵ سال از تأسیس این فروشگاه اینترنتی، سومین نسل خود را پشت سر میگذارد و با توجه به افزایش تنوع کالاها، دیگر استراتژی تولید محتوا بهصورت متمرکز پاسخگو نیست و از اینرو کامنت کاربران برای کالاهای مختلف نقش بسیار پررنگتری به خود گرفته است. با افزایش تنوع کالایی، تولید محتوا باید با مشارکت کاربران و از طریق کامنتها انجام شود. تغییر استراتژی محتوایی دیجیکالا باعث شد رویهای برای تشویق کاربران به منظور کامنت گذاشتن در پیش گرفته شود و در نتیجه تعداد کامنتهای ثبتشده افزایش یافت؛ بهطوریکه در حال حاضر کاربران دیجیکالا بهصورت روزانه میانگین بیش از ۴۰ هزار کامنت (رکورد بیش از ۶۰ هزار کامنت در یک روز) در این فروشگاه ثبت میکنند. با پیادهسازی امکان ضمیمه کردن تصاویر و ویدئو در کامنت، به این نتیجه رسیدیم که مدیریت این بخش وظیفهی بسیار سنگینی به تیم محتوا تحمیل میکند؛ برای مثال تعداد کامنتها طی یک ماه اخیر بیش از ۵۰ درصد افزایش یافته است. اول با یک استارتاپ که در دیجیکالا نکست فعال بود، در خصوص این موضوع وارد مذاکره شدیم؛ اما پس از گذشت مدتی متوجه شدیم راهکار این استارتاپ قابلیت پیادهسازی در سیستم دیجیکالا ندارد. همزمان با این موارد، نوید شهدی وارد دیجیکالا شد.
- توسعه سیستم هوش مصنوعی چندماه طول کشید و پیشرفت این سیستم چطور بوده است؟
- نوید شهدی: من ابتدای امسال به دیجیکالا اضافه شدم و مدیریت تیم هوش مصنوعی را بر عهده گرفتم. پس از تشکیل تیم هوش مصنوعی، ما با تیمهای متعدد فعال در دیجیکالا به صحبت نشستیم تا چالشها و گلوگاههایی که میشد با راهکارهای مبتنی بر هوش مصنوعی حل کنیم، شناسایی کنیم. موضوع مدیریت کامنتها از جملهی مواردی بود که انرژی زیادی از تیم محتوا میگرفت و توسعهی یک الگوریتم مبتنی بر یادگیری ماشین میتوانست بار این کار را سبکتر کند.
اوایل سال جاری و پس از توافق برای پیادهسازی این سیستم، یکی دوماه مذاکره برای مشخص کردن قوانین صرف کردیم و سه ماه طول کشید تا دیتای مورد نیاز جمعآوری شود. تیم محتوا کار خود را آغاز کرد؛ بهطوریکه تمام دادهها بالغ بر یک میلیون و هشتصدهزار کامنت با لیبل گردآوری شد. اوایل مهرماه ۱۳۹۹ این سیستم تأیید خودکار مورد استفاده قرار گرفت.
البته پیش از توسعهی سیستم جدید، یک الگوریتم دیگر مورد استفاده قرار میگرفت که فقط قادر بود در مورد رد کردن کامنتها اظهارنظر کند. البته این سیستم تنها قادر به رد کردن ۲ درصد کامنتها بوده است. قطعا افزایش تعداد کامنتها باعث شد این سیستم عملکرد چندان مثبتی نداشته باشد؛ درحالیکه درصد موففیت الگوریتم هوش مصنوعی جدید برای رد، تأیید یا شناسایی بهعنوان کامنتی که باید عامل انسانی در مورد آن نظر دهد، بیش از ۹۸ درصد است.
توسعه، آموزش و آزمون این سیستم حدود ۶ ماه زمان برد و در حال حاضر ۷۵ تا ۸۰ درصد از کامنتهای ثبتشده توسط سیستم هوش مصنوعی مدیریت میشود.
- آیا هوش مصنوعی موفق شده است برداشت سلیقهای عامل انسانی در قوانین تأیید یا رد نظرات را برطرف کند؟
- نوید شهدی: با توجه به برداشت سلیقهای عوامل انسانی از قوانین تعیینشده برای رد یا قبول کردن کامنتها، این موضوع با اضافه شدن ماشین و هوش مصنوعی از بین رفته است؛ البته این مشکل خیلی محدود بود و تناقض عملکرد در رد یا تأیید کامنتها چندان پررنگ نبود.
- اغلب چه کامنتهایی منتشر نمیشوند؟
- وحید پولادی: کامنتها بهعنوان بخشی از محتوای دیجیکالا در نظر گرفته میشوند و از اینرو بسیار ارزشمند هستند. اما برخی کامنتها ارتباطی با کالا مورد نظر ندارند و بیشتر به تشریح تجربهی خرید میپردازند که از اینرو منتشر نمیشوند. برای مثال به کامنتهایی در رابطه با شکایت از دیر رسیدن کالا اشاره کرد که ارتباطی با خود کالا ندارد. البته منتشر نشدن کامنتها در خصوص مشکلات اینچنینی به منزلهی نادیده گرفته شدن آنها نیست؛ این نوع کامنتها هرچند در صفحهی مورد نظر منتشر نمیشوند؛ اما پیام کاربر در قالب یک مسئله درونسازمانی برای پیگیری به واحدهای مربوط ارسال میشود. در فاز بعدی نیز تلاش بر این است تا تشخیص این کامنتها توسط هوش مصنوعی انجام شود.
- پردازش طبیعی زبانها، دیتای جالبی جز تأیید و رد نظرات در اختیار قرار میدهد؛ آیا برنامهای برای گسترش استفاده از قابلیتهای هوش مصنوعی و اطلاعات استخراجشده وجود دارد؟
- نوید شهدی: تأیید یا رد کامنتها را باید بخش کوچکی از سیستم هوش مصنوعی مرتبط با کامنتها عنوان کرد که در دست توسعه داریم. اطلاعاتی که کاربران در قالب کامنتهای برای محصولات مختلف ثبت میکنند، در زمینههای بسیاری قابل استفاده است. برای مثال با استفاده از کامنت ثبتشده برای یک محصول، میتوان نقطهی قوت و ضعف محصول را استخراج کرد و همچنین توصیه برای خرید یا نخریدن محصول را براساس منظور کاربر از کامنت استنباط کرد. اطلاعات برگرفته از کاربران در قالب کامنتها را که اتفاقا حجم بالایی نیز دارند، میتوان در انواع سناریوهای مختلف مورد استفاده قرار داد که از جملهی این کاربردها میتوان به بخش نظرات، بخش پیشنهاد به کاربران دیگر و رتبهبندی محصولات استفاده کرد.
- وحید پولادی: استفاده از هوش مصنوعی علاوه بر اینکه بار عملیاتی کنترل کامنتها را کم میکند، در آینده باعث خواهد شد بتوان معنای کامنتهای ثبتشده را استخراج کرد. برای مثال در مورد یک گوشی هوشمند، احتمالا کامنتهایی در مورد ماژولهای مختلف نظیر باتری، دوربین و سایر موارد با نقد عملکرد هر یک از این ماژولها شامل موارد نکات مثبت و منفی ثبت شده است. هوش مصنوعی پس از تصمیمگیری در مورد انتشار یا رد شدن کامنت، میتواند توصیه برای خرید یا عدم خرید محصول را براساس معنای هر یک از کامنتها بهصورت خلاصه به کاربران نمایش دهد. کاربرد دیگری که برای این سیستم در نظر گرفته شده، جلوگیری از انتشار کامنتهای غیر واقعی است.
- قیمت بالا و وجود کالاهای غیر اصل از جمله انتقادات واردشده به دیجیکالا است؛ آیا برنامهای برای هوش مصنوعی به منظور شناسایی چنین مواردی دارید؟ آیا سیستم گزارشدهی کامنتها میتواند در این موارد کمک کند؟
- وحید پولادی: برای درک اینکه چطور یک کالای غیر اصل در همان ابتدا شناسایی نمیشود، بهتر است ابتدا نگاهی به فرایند ثبت یک کالا در دیجیکالا داشته باشیم. سیستم دیجیکالا به نوعی طراحی شده است که امکان ثبت کالای مشابه در آن وجود ندارد. برای مثال در صورتی که یک ساعت اورجینال توسط یک فروشنده در حال فروش باشد، دیجیکالا اجازه نمیدهد تأمینکنندهای دیگر این محصول را با ایجاد یک صفحهی محصول جدید عرضه کند. حال فرض کنید که تأمینکنندهی دوم، نسخهی غیر اصل کالای مورد نظر را برای فروش قرار داده است و از اینرو هر دو کالا از طریق یک صفحه محصول با تأمینکنندگان مختلف به فروش میرسند. در این شرایط وقتی کاربری کامنتی در مورد غیر اصل (فیک) بودن کالا منتشر میکند، بلافاصله موضوع به بخش مانیتورینگ مارکتپلیس گزارش میشود و این بخش از تأمینکننده درخواست میکند مدارک خود دال بر اصل بودن کالا را ارسال کند. در صورتی که تأمینکننده قادر به اثبات ادعای خود مبنی بر اصل بودن کالا نباشد، دیجیکالا کالای این تأمینکننده را حذف میکند. پس استفاده از هوش مصنوعی فقط به شناسایی کامنتها در این رابطه محدود میشود.
- نوید شهدی: پروژهای طولانیمدت تعریف شده است که در نظر داریم با استفاده از فاکتورهای مختلفی نظیر قیمت محصولات در بازار آفلاین، ارزش دلار و سایر پارامترهای دخیل، به برآورد قیمت کالاها بپردازیم. کامنت در مقطع فعلی نمیتواند نقش مؤثری برای محاسبه قیمت داشته باشند؛ هرچند میتوان با استفاده از کامنتها فهمید نظر کاربران در رابطه با قیمت چیست.
- با توجه به تغییر استراتژی محتوایی دیجیکالا در مورد بخش کامنت، چه برنامهایهایی برای این بخش دارید؟
- وحید پولادی: ما در نظر داریم روند کامنتگذاری را به سمت محتوای ویدیویی سوق دهیم و در جریان این تغییر و تحول، به کاربرانمان نیز آموزش دهیم تا بتوانند ویدیوهایی باکیفیت تولید کنند. برای مثال کاربران میتوانند برای کالاهای مختلف ویدیوی جعبهگشایی تولید و در صفحهی محصول آپلود کنند و حتی در آینده قادر خواهند بود از این ویدیوها درآمدزایی کنند.
نظر شما در خصوص استفاده از هوش مصنوعی برای مدیریت محتوا و استخراج معنا چیست؟
نظرات