خلاصهسازی خودکار چند سندی مبتنی بر استخراج مفاهیم
نویسنده
پورمعصومی، آصف
استاد راهنما
کاهانی، محسن
مقطع تحصیلی
کارشناسیارشد
سال دفاع از پایان نامه
۱۳۹۰
رشته
کامپیوتر - نرمافزار
توصیفگر
خلاصه سازی چندسندی
توصیفگر
خلاصه سازی خودکار
توصیفگر
مفاهیم
توصیفگر
استخراج
چکیده فارسی
خلاصه سازی خودکار چند سندی، روشی برای ارائه فشرده مطالبی است که در ارتباط با یک موضوع بوده ولی جهت دید آنها متفاوت از یکدیگر می باشند. خلاصه خوب، باید بیانگر زمینه کلی بوده و ضمن بیان دیدگاههای مختلف موجود در متن از خوانایی و پیوستگی بالایی برخوردار باشد. در این مقاله با بهره گیری شکل جدیدی از روش استخراج روابط معنایی موجود در متن (LSA یا LSI) و تکنیک برچسب زنی معنایی نقش لغات(SRL)، روشی جدید برای خلاصه سازی چند سندی شده است. در ابتدا با استفاده از ماتریس کلمه- سند به جای ماتریس کلمه- جمله و با بهره گیری از LSA، جملات مهم مرتبط با زمینه استخراج می شود. در گام بعدی با استفاده از تکنیک SRL و با استفاده از WordNet شباهت معنایی جملات استخراج شده و در نهایت جملات شبیه به هم حذف می شوند. نتایج آزمایش ها برروی داده های DUC2007 حاکی از افزایش چشمگیر دقت در قیاس با روش های قبلی مبتنی بر LSAو سیستم های موجود در DUC2007 میباشد.