Question Answering System Based on
Semantic Relations
نویسنده
قائمی، هادی - ghaemi, hadi
استاد راهنما
کاهانی، محسن
مقطع تحصیلی
کارشناسی ارشد
سال دفاع از پایان نامه
۱۳۹۳
رشته
مهندسی کامپیوتر - هوش مصنوعی
توصیفگر
سیستم های پرسش و پاسخ
توصیفگر
روابط معنایی
توصیفگر
موتورهای جستجو
توصیفگر
ارزیابی
توصیفگر
پرسش ها
توصیفگر
چارچوب توصیف منابع (RDF)
چکیده فارسی
با افرایش و توسعه وب، نیاز است تا موتورهای جستجو هوشمندتر از قبل رفتار نمایند. در بیشتر موارد کاربران به جای لیستی از اسناد به بخش کوچکی از اطلاعات نیاز دارند تا به جای مطالعه و بررسی کل اسناد، بخش کوچکی از سند را مطالعه نمایند. با توجه به نیاز کاربران، نسل بعدی موتورهای جستجو، سیستمهای پرسش و پاسخ میباشند. سیستمهایی که به کاربران اجازه میدهند تا نیازهای اطلاعاتی خود را در قالب پرسشهای زبان طبیعی به سیستم بدهند و پاسخها را به صورت دقیق دریافت نمایند. هدف از تولید و گسترش سیستمهای پرسش و پاسخ، دادن پاسخ دقیق و کوتاه به پرسش داده شده به زبان طبیعی میباشد. در این پایان¬نامه روشی جدید برای سیستمهای پرسش و پاسخ با پرسشهای Factoid از نوع Wh ، ارائه شده است. در روش ارائه شده ابتدا روابط معنایی موجود در متن استخراج و سپس در قالب RDF ذخیره میشوند. همچنین در ادامه برای پاسخدهی به پرسشها، ابتدا دستهی پرسش داده شده به زبان طبیعی مشخص میشود. برای اینکار از یک روش دستهبندی ترکیبی استفاده شده است. در گام بعد بخشهای اصلی پرسش استخراج میشود. در ادامه این بخشها توسط مترادفاتشان بسط داده میشوند. با توجه به دسته مشخص شده برای پرسش، پرسش را به پرسوجوهای SPARQL تبدیل کرده و بر روی دادهها اعمال میشود. پاسخ نهایی از میان خروجیهای پرسوجو گزینش میشود.
در مدل پیشنهادی در ابتدا روابط معنایی با توجه به گروههای فعلی، اسمی و حرف اضافه استخراج می شود. در این مرحله سعی شده است روابط با توجه به تمامی افعال درون جمله استخراج گردند. برای پاسخ گویی به پرسشهای زبان طبیعی ابتدا کلاس هر پرسش مشخص میشود. برای این کار ابتدا مجموعه ویژگیهای پرسش استخراج میشود و در ادامه با توجه به ویژگیهای پرسش، توسط یک روش دستهبندی ترکیبی، کلاس پرسش مشخص میشود. با توجه به کلاس و ساختار پرسش، پرسش داده شده به پرسوجوی SPARQL تبدیل میشود. پرسوجوی ایجاد شده به ذخایر RDF اعمال میشود. در انتها از پاسخهای حاصل از پرسوجو، پاسخی انتخاب میشود که رابطهی مربوط به آن بیشترین شباهت با پرسش را داشته باشد.
ارزیابی سیستم پیشنهادی برروی داده¬های استاندارد کنفرانس TREC-8 و با استفاده از معیار ارزیابی MRR صورت گرفته است.
چکیده لاتین
As data available on the web grows dramatically, search engines need to behave more intelligently than before. On most occasions, users want a small piece of information and not a list of documents. Therfore, the next generation of search engines will be Question Answering systems. Question answering systems aim to take a question in natural language, and return the correct answer as a short natural language answer. This thesis focuses on building a system to answer WH-type factoid questions. In the proposed method, first, the semantic relations from the retrieved documents are extracted, converted into RDF and stored in RDF databases. In order to answer the question, initially, the class of the natural language question is determined. For this purpose, a hybrid classification method is utilized. Once the question class is determined, the natural language question is converted to a SPARQL query and is executed over the RDF databases. Finally, the answer is selected from the results to the query.
The evaluation of the proposed method over the TREC dataset using MRR (mean reciprocal rank) metric proved to be promising.