Mining information for solving cold item problem in opinion mining
نویسنده
پورغلامعلی، فاطمه - pourgholamali, fatemeh
استاد راهنما
کاهانی، محسن
استاد مشاور
باقری، ابراهیم
مقطع تحصیلی
دکتری (Ph.D)
سال دفاع از پایان نامه
۱۳۹۸
رشته
مهندسی کامپیوتر - نرم افزار
توصیفگر
اطلاعات
توصیفگر
نظرکاوی
توصیفگر
سیستم های توصیه گر
توصیفگر
محصول سرد
چکیده فارسی
همه روزه کاربران زیادی با مراجعه به وب سایت های تجاری اقدام به بررسی و خرید اقلام مورد نیاز خود می کنند. وب سایت ها با فراهم کردن سرویس های شخصی سازی مانند سیستم های پیشنهاددهنده و سرویس های بازبینی محصولات، برای پیدا کردن محصولات مورد نیاز و بررسی و انتخاب آن ها به کاربران کمک زیادی می کنند. این کار بر اساس مشابهت امتیازات و یا تراکنش های خرید، انجام می شود. کاربر نیز با دانش قبلی یا با مراجعه به نظراتی که کاربران دیگر برای محصولات گذاشته اند، از بین محصولات کاندید، محصولی را انتخاب و خریداری می نماید. این در حالیست که بسیاری از محصولات، سابقه تراکنشی و یا نظری زیادی ندارند؛ این مشکل که مشکل محصول سرد نام دارد، با توجه به حجم زیاد محصولات فاقد امتیاز و نظر اهمیت ویژه ای به خود گرفته است.
راه کار کلی برای حل مشکل محصول سرد، استفاده از اطلاعات جانبی، و ارائه یک بازنمایی مناسب برای محصول سرد می باشد. با کمک این بازنمایی، برای محصولات سرد پیشنهاد مناسب ایجاد می شود یا نظراتی تولید می شود که تبیین کننده جنبه های مختلف محصول باشد. روش های موجود اغلب بر مبنای اطلاعاتی جانبی مانند مشخصات ساخت یافته محصول، عمل می کنند؛ تکیه بر یک نوع منبع اطلاعاتی از قبیل مشخصات ساخت یافته محدود کننده است؛ چرا که در بسیاری از دامنه ها مشخصات ساخت یافته محصولات ارائه نشده است و یا از دقت و کیفیت لازم برخوردار نیست. یکی از منابعی که این محدودیت را کم می کند، منابع غیر ساخت یافته مانند محتواهای متنی می باشد که میزان دسترس پذیری بالاتری نسبت به مشخصات ساخت یافته دارد. اطلاعات دیگری هم در یک وب سایت تجاری موجود می باشد که در این زمینه کمتر مورد توجه قرار گرفته است، از قبیل اطلاعات کاربران و روابط بین آن ها.
در این رساله، با در نظر گرفتن دو جنبه ذکر شده از محصول سرد یعنی کمبود امتیازات و نظرات، راه کارهایی برای مقابله با محصول سرد ارائه شده است. به این ترتیب که محدودیت های روش های پیشین در استفاده از اطلاعات جانبی کنار گذاشته شده و با استفاده حداکثری از انواع منابع موجود و ایجاد بازنمایی هایی معنایی با کمک روش های یادگیری عمیق، راه کاری کارا و تعمیم پذیر ارائه می شود. به این منظور سه مولفه طراحی شده است: 1) استفاده از محتواهای متنی مربوط به محصولات و کاربران و جنبه های زمانی به منظور ایجاد بازنمایی مناسب برای محصولات و کاربران و ارائه پیشنهاد مناسب. 2) استفاده از اطلاعات ساخت یافته محصولات در ترکیب با اطلاعات متنی به منظور انتخاب نظرات مناسب برای محصول سرد، و در انتها 3) ارائه یک چارچوب قابل تعمیم برای مدل سازی انواع اطلاعات جانبی از قبیل اطلاعات ساخت یافته و غیرساخت یافته، اطلاعات کاربران و تراکنش های آن ها به منظور ایجاد بازنمایی برای محصولات و جملات نظری و انتخاب مهم ترین و مناسب ترین جملات برای محصول سرد.
راه کار پیشنهادی علاوه بر داشتن مزیت قابلیت انعطاف و تعمیم پذیری برای دامنه های مختلف، نشان دهنده افزایش کارایی و دقت در مقایسه با روش های موجود، از دو دیدگاه کیفی و کمی بوده است.
چکیده لاتین
Product ratings and reviews written by the reviewers on e-commerce shopping sites have become a critical information source for making recommendations and purchase decisions. An important challenge, however, is that the vast majority of products (e.g., 90% of products on amazon.com) do not receive enough attention and lack sufficient ratings and reviews by the users. They are so-called cold products. To remedy this problem, many have exploited side information and build representations for system elements (such as products, users, reviews) and predict ratings according to those representations or generate reviews for these products by sampling review sentences from closely related warm products. However, most of them, rely solely on product specification, which cannot address this issue when structured specifications are not available.
IN, this dissertation, we not only employ product specification, but also a wide range of information such as free form textual content as well as product-review, product-user, and user-review interactions. We propose to use such side information and exploit neural architectures to build semantic representations for the system entities. The generated representations are exploited to model the relations between cold products and other entities. More specifically, we propose to solve the cold product problem in a generalizable form using three steps: 1) Exploit free form textual content to build semantic representations for the products and users and use them in the recommender frameworks. 2) Use a combination of structured specifications and textual content to make representations for products and reviews, which reveal the implicit relations between products and reviews and use them to select reviews for the cold products. 3) Propose a generalizable framework to select review sentences. As such, we show how neural graph embeddings can be used to encode product, user, and review information into an attributed heterogeneous graph representation. We further propose a method to review relevance and importance can be considered using graph traversal to select appropriate review sentences for a given cold product.
Finally, we systematically compare the performance of our work with those of several state-of-the-art baselines on various datasets collected from CNET.com and rottentomatoes.com with different characteristics from both quantitative (e.g., the Recall Oriented Understudy for Gisting Evaluation (ROUGE) metrics) and qualitative aspects and show how our proposed approach can provide statistically significantly improved performance over various strong baselines.