دیجی کالا چگونه مدیریت بخش کامنت را به دست هوش مصنوعی سپرده است؟

۲۲ آذر ۱۳۹۹ | ۱۷:۱۷ ۲ دی ۱۳۹۹ زمان مورد نیاز برای مطالعه: ۷ دقیقه

به نقل از زومیت؛ دیجی‌کالا چندی پیش با انتشار خبری اعلام کرد که تأیید و رد کامنت‌های ثبت‌شده توسط کاربران را به هوش مصنوعی سپرده است. در این رابطه به گفت‌وگو با مدیر تیم هوش مصنوعی و محتوای دیجی‌کالا نشستیم تا از روند توسعه‌ی این سیستم آگاه شویم.
اواخر آبان‌ماه سال جاری دیجی‌کالا با انتشار خبری اعلام کرد که بخش اعظم مدیریت بخش کامنت‌ها در این فروشگاه به هوش مصنوعی سپرده شده است. برای آگاهی از کم و کیف این سیستم به گفت‌وگو با مدیران دیجی‌کالا نشستیم. در این گفت‌وگو، وحید پولادی، مدیر بخش محتوای دیجی‌کالا و نوید شهدی، مدیر بخش هوش مصنوعی، به ارائه اطلاعاتی در رابطه با این سیستم پرداختند.

امیرحسن موسوی، مدیر روابط دیجی‌کالا، در ابتدای گفت‌وگو اعلام کرد که برای توسعه‌ی این سیستم دو تیم محتوا و هوش مصنوعی درگیر بوده‌اند. البته به گفته‌ی موسوی، پیش از تشکیل تیم هوش مصنوعی، یکی از استارتاپ‌های حاضر در دیجی‌ نکست در این فرایند شرکت داشته که در ادامه‌ی ماجرا با تشکیل تیم هوش مصنوعی دیجی‌کالا به مدیریت نوید شهدی، فرایند توسعه به تیم هوش مصنوعی دیجی‌کالا سپرده شده است.

– کامنت کاربران چه جایگاهی در ساختار محتوای دیجی‌کالا دارد؟

– وحید پولادی: فرایند مدیریت محتوا در دیجی‌کالا پس از گذشت ۱۵ سال از تأسیس این فروشگاه اینترنتی، سومین نسل خود را پشت سر می‌گذارد و با توجه به افزایش تنوع کالاها، دیگر استراتژی تولید محتوا به‌صورت متمرکز پاسخگو نیست و از این‌رو کامنت کاربران برای کالاهای مختلف نقش بسیار پررنگ‌تری به خود گرفته است. با افزایش تنوع کالایی، تولید محتوا باید با مشارکت کاربران و از طریق کامنت‌ها انجام شود. تغییر استراتژی محتوایی دیجی‌کالا باعث شد رویه‌‌ای برای تشویق کاربران به منظور کامنت گذاشتن در پیش گرفته شود و در نتیجه تعداد کامنت‌های ثبت‌شده افزایش یافت؛ به‌طوری‌که در حال حاضر کاربران دیجی‌کالا به‌صورت روزانه میانگین بیش از ۴۰ هزار کامنت (رکورد بیش از ۶۰ هزار کامنت در یک روز) در این فروشگاه ثبت می‌کنند. با پیاده‌سازی امکان ضمیمه کردن تصاویر و ویدئو در کامنت، به این نتیجه رسیدیم که مدیریت این بخش وظیفه‌ی بسیار سنگینی به تیم محتوا تحمیل می‌کند؛ برای مثال تعداد کامنت‌ها طی یک ماه اخیر بیش از ۵۰ درصد افزایش یافته است. اول با یک استارتاپ که در دیجی‌ نکست فعال بود، در خصوص این موضوع وارد مذاکره شدیم؛ اما پس از گذشت مدتی متوجه شدیم راهکار این استارتاپ قابلیت پیاده‌سازی در سیستم دیجی‌کالا ندارد. هم‌زمان با این‌ها، نوید شهدی وارد دیجی‌کالا شد.

– توسعه سیستم هوش مصنوعی چندماه طول کشید و پیشرفت این سیستم چطور بوده است؟ 

– نوید شهدی: من ابتدای امسال به دیجی‌کالا اضافه شدم و مدیریت تیم هوش مصنوعی را بر عهده گرفتم. پس از تشکیل تیم هوش مصنوعی، ما با تیم‌های متعدد فعال در دیجی‌کالا به صحبت نشستیم تا چالش‌ها و گلوگاه‌هایی که می‌شد با راهکارهای مبتنی بر هوش مصنوعی حل کنیم، شناسایی کنیم. موضوع مدیریت کامنت‌ها از جمله چیزهایی بود که انرژی زیادی از تیم محتوا می‌گرفت و توسعه‌ی یک الگوریتم مبتنی بر یادگیری ماشین می‌توانست بار این کار را سبک‌تر کند.
اوایل سال‌ جاری و پس از توافق برای پیاده‌سازی این سیستم، یکی دو ماه مذاکره برای مشخص کردن قوانین صرف کردیم و سه ماه طول کشید تا دیتای لازم جمع‌آوری شود. تیم محتوا کار خود را آغاز کرد؛ به‌طوری‌که تمام داده‌ها بالغ بر یک میلیون و هشتصدهزار کامنت با لیبل گردآوری شد. اوایل مهرماه ۱۳۹۹ این سیستم تأیید خودکار استفاده شد.
البته پیش از توسعه‌ی سیستم جدید، یک الگوریتم دیگر استفاده می‌شد که فقط قادر بود درباره‌ی رد کردن کامنت‌ها اظهارنظر کند. البته این سیستم تنها قادر به رد کردن ۲ درصد کامنت‌ها بوده است. قطعا افزایش تعداد کامنت‌ها باعث شد این سیستم عملکرد چندان مثبتی نداشته باشد؛ در حالی ‌که درصد موففیت الگوریتم هوش مصنوعی جدید برای رد، تأیید یا شناسایی به‌عنوان کامنتی که باید عامل انسانی درباره‌ی آن نظر دهد، بیش از ۹۸ درصد است.
توسعه، فرایند یادگیری ماشین و آزمون این سیستم حدود ۶ ماه زمان برد و در حال حاضر ۷۵ تا ۸۰ درصد از کامنت‌های ثبت‌شده توسط سیستم هوش مصنوعی مدیریت می‌شود.

– آیا هوش مصنوعی موفق شده است برداشت سلیقه‌ای عامل انسانی در قوانین تأیید یا رد نظرات را برطرف کند؟

– نوید شهدی: با توجه به برداشت سلیقه‌ای عوامل انسانی از قوانین تعیین‌شده برای رد یا قبول کردن کامنت‌ها، این موضوع با اضافه شدن ماشین و هوش مصنوعی از بین رفته است؛ البته این مشکل خیلی محدود بود و تناقض عملکرد در رد یا تأیید کامنت‌ها چندان پررنگ نبود.

– اغلب چه کامنت‌هایی منتشر نمی‌شوند؟

– وحید پولادی: کامنت‌ها به‌عنوان بخشی از محتوای دیجی‌کالا در نظر گرفته می‌شوند و از این‌رو بسیار ارزشمند هستند. اما برخی کامنت‌ها ارتباطی با آن کالا ندارند و بیشتر به تشریح تجربه‌ی خرید می‌پردازند که از این‌رو منتشر نمی‌شوند. برای مثال به کامنت‌هایی در رابطه با شکایت از دیر رسیدن کالا اشاره کرد که ارتباطی با خود کالا ندارد. البته منتشر نشدن کامنت‌ها در خصوص مشکلات این‌چنینی به منزله‌ی نادیده گرفته شدن آن‌ها نیست؛ این نوع کامنت‌ها هرچند در صفحه‌ی فوق منتشر نمی‌شوند، اما پیام کاربر در قالب یک مسأله درون‌سازمانی برای پیگیری به واحد‌های مربوط ارسال می‌شود. در فاز بعدی هم تلاش بر این است تا تشخیص این کامنت‌ها توسط هوش مصنوعی انجام شود.

مصاحبه با وحید فولادی و نوید شهدی

– پردازش طبیعی زبان‌‌ها، دیتای جالبی جز تأیید و رد نظرات در اختیار قرار می‌دهد؛ آیا برنامه‌ای برای گسترش استفاده از قابلیت‌های هوش مصنوعی و اطلاعات استخراج‌شده وجود دارد؟

– نوید شهدی: تأیید یا رد کامنت‌ها را باید بخش کوچکی از سیستم هوش مصنوعی مرتبط با کامنت‌ها عنوان کرد که در دست توسعه داریم. اطلاعاتی که کاربران در قالب کامنت‌های برای محصولات مختلف ثبت می‌کنند، در زمینه‌های بسیاری قابل استفاده است. برای مثال با استفاده از کامنت ثبت‌شده برای یک محصول، می‌توان نقطه‌ی قوت و ضعف محصول را استخراج کرد و همچنین توصیه برای خرید یا نخریدن محصول را بر اساس منظور کاربر از کامنت استنباط کرد. اطلاعات برگرفته از کاربران در قالب کامنت‌ها را که اتفاقا حجم بالایی هم دارند، می‌توان در انواع سناریوهای مختلف استفاده کرد که از جمله‌ی این کاربردها می‌توان به بخش نظرات، بخش پیشنهاد به کاربران دیگر و رتبه‌بندی محصولات استفاده کرد.

– وحید پولادی: استفاده از هوش مصنوعی علاوه بر اینکه بار عملیاتی کنترل کامنت‌ها را کم می‌کند، در آینده باعث خواهد شد بتوان معنای کامنت‌های ثبت‌شده را استخراج کرد. برای مثال درباره‌ی یک گوشی ‌هوشمند، احتمالا کامنت‌هایی درباره‌ی ماژول‌های مختلف نظیر باتری، دوربین و سایر چیزها با نقد عملکرد هر یک از این ماژول‌ها شامل موارد نکات مثبت و منفی ثبت شده است. هوش مصنوعی پس از تصمیم‌گیری درباره‌ی انتشار یا رد شدن کامنت، می‌تواند توصیه برای خریدن یا نخریدن محصول را بر اساس معنای هر یک از کامنت‌ها به‌صورت خلاصه به کاربران نمایش دهد. کاربرد دیگری که برای این سیستم در نظر گرفته شده، جلوگیری از انتشار کامنت‌های غیر واقعی است.

– قیمت‌ بالا  و وجود کالاهای غیر اصل از جمله انتقادات واردشده به دیجی‌کالا است؛ آیا برنامه‌ای برای هوش مصنوعی به منظور شناسایی چنین چیزهایی دارید؟ آیا سیستم گزارش‌دهی کامنت‌ها می‌تواند در این‌باره کمک کند؟

– وحید پولادی: برای درک اینکه چطور یک کالای غیر اصل در همان ابتدا شناسایی نمی‌شود، بهتر است ابتدا نگاهی به فرایند ثبت یک کالا در دیجی‌کالا داشته باشیم. سیستم دیجی‌کالا به نوعی طراحی شده است که امکان ثبت کالای مشابه در آن وجود ندارد. برای مثال در صورتی که یک ساعت اورجینال توسط یک فروشنده در حال فروش باشد، دیجی‌کالا اجازه نمی‌دهد تأمین‌کننده‌ای دیگر این محصول را با ایجاد یک صفحه‌ی محصول جدید عرضه کند. حال فرض کنید که تأمین‌کننده‌ی دوم، نسخه‌ی غیر اصل این کالا را برای فروش قرار داده است و از این‌رو هر دو کالا از طریق یک صفحه محصول با تأمین‌کنندگان مختلف به فروش می‌رسند. در این شرایط وقتی کاربری کامنتی درباره‌ی غیر اصل (فیک) بودن کالا منتشر می‌کند، بلافاصله موضوع به بخش مانیتورینگ مارکت‌پلیس گزارش می‌شود و این بخش از تأمین‌کننده درخواست می‌کند مدارک خود دال بر اصل بودن کالا را ارسال کند. در صورتی که تأمین‌کننده قادر به اثبات ادعای خود مبنی بر اصل بودن کالا نباشد، دیجی‌کالا کالای این تأمین‌کننده را حذف می‌کند. پس استفاده از هوش مصنوعی فقط به شناسایی کامنت‌ها در این رابطه محدود می‌شود.

– نوید شهدی: پروژه‌ای طولانی‌مدت تعریف شده است که در نظر داریم با استفاده از فاکتورهای مختلفی نظیر قیمت محصولات در بازار آفلاین، ارزش دلار و سایر پارامترهای دخیل، به برآورد قیمت کالاها بپردازیم. کامنت‌ در مقطع فعلی نمی‌تواند نقش مؤثری برای محاسبه قیمت داشته باشند؛ هرچند می‌توان با استفاده از کامنت‌ها فهمید نظر کاربران در رابطه با قیمت چیست.

– با توجه به تغییر استراتژی محتوایی دیجی‌کالا درباره‌ی بخش کامنت، چه برنامه‌ای‌هایی برای این بخش دارید؟

– وحید پولادی: ما در نظر داریم روند کامنت‌گذاری را به سمت محتوای ویدیویی سوق دهیم و در جریان این تغییر و تحول، به کاربرانمان هم آموزش دهیم تا بتوانند ویدیوهایی باکیفیت تولید کنند. برای مثال کاربران می‌توانند برای کالاهای مختلف ویدیوی جعبه‌گشایی تولید و در صفحه‌ی محصول آپلود کنند و حتی در آینده قادر خواهند بود از این ویدیوها درآمدزایی کنند.

 

این مطلب اولین بار در زومیت منتشر شده و در اتاق خبر دیجی‌کالا بازنشر شده است.

دیدگاه شما

۴ comment
  1. Avatar یک دیجی‌کالافَن

    سلام و عرض ادب خدمت سردبیر محترم دیجی‌کالامَگ؛
    درست است که این مصاحبه از سایت زومیت بازنشر شده است؛ امّا به نظر اینجانب عنوان انتخاب‌شده برای آن از نظر دستورزبان فارسی ایراد دارد:
    شایان ذکر است، عنوان مقاله در سایت زومیت به درستی درج شده است (لینک زیر):
    https://www.zoomit.ir/interview/365754-digikala-data-science-solutions-for-comment/

    با توجّه به مطالب بالا، خواهشمند است نسبت‌به اصلاح عنوان و حذف «آیا» از ابتدای آن اقدام فرمایید.
    با احترام فراوان.

    1. سلام وقت بخیر. از توجه شما سپاسگزاریم.

  2. Avatar شعبانی

    سلام ، دیجی کالا هنوز در واریز بهنگام امتیاز دیجی کلاب که یه برنامه نویسی ساده لازم داره مشکل داره ولی جملات بدون قاعده رو پردازش معنایی و دسته بندی میکنه!!!!