طراحی سیستم پرسش و پاسخ مبتنی بر کلمات کلیدی و قالب های SPARQL پویا
عنوان لاتین
Keyword-based Question Answering System Using Dynamic SPARQL Templates
نویسنده
میر احمدی چناروئیه، فاطمه - mirahmadi, fatemeh
استاد راهنما
کاهانی، محسن
مقطع تحصیلی
کارشناسی ارشد
سال دفاع از پایان نامه
۱۳۹۵
رشته
مهندسی کامپیوتر - نرم افزار
توصیفگر
سیستم های پرسش و پاسخ
توصیفگر
پرس وجوهای SPARQ
توصیفگر
جستجو
توصیفگر
جستجوی کلیدواژه ای
توصیفگر
زبانشناسی
چکیده فارسی
سیستم های پرسش و پاسخ شکل پیچیده تری از سیستم های بازیابی اطلاعات هستند که به جای برگرداندن اسناد مرتبط با سوال کاربر، سعی در استخراج جوابی برای سوال کاربر دارند. سوال کاربر می تواند به صورت یک سوال زبان طبیعی بیان شود و یا اینکه از کلمات کلیدی برای بیان این منظور استفاده کرد.
یکی از منابعی که سیستم ها برای پیدا کردن جواب دقیق از آن استفاده می کنند، ابر داده پیوندی است. بازیابی اطلاعات مبتنی بر دادههای پیوندی، به ما کمک می کند تا با سرعت و دقت بالایی به جواب صحیح دست یابیم، اما نیازمند داشتن دانش در مورد هستان نگار لایه زیرین و همچنین توانایی ساخت پرسوجوهای رسمی مانند SPARQL است که برای کاربران عادی، کاری دشوار خواهد بود. از طرف دیگر، تجربه کاربران در کار با موتورهای جستجو نشان داده است، کاربران بیشتر تمایل دارند نیاز اطلاعاتی خود را در قالب کلمات کلیدی مطرح کنند. در این پایان نامه، به منظور خودکارسازی فرایند ساخت پرس وجوی رسمی ، روشی برای تبدیل کلمات کلیدی کاربر به پرس وجوی SPARQL ارائه شده است که مبتنی بر ساخت قالب های پویاست . در روش پیشنهادی، کلمات کلیدی سوال کاربر با کمک ابزارهای حاشیه نویسی معنایی و روش های موجود به مفاهیم پایگاه دانش نگاشت داده می شود و با توجه به نوع و تعداد این مفاهیم و همچنین قالب هایی که از تحلیل سوالات مشابه استخراج شدهاست، قالب (های) نهایی SPARQL برای سوال کاربر ایجاد میشود. در مرحله بعد، با جایگزینی URIهای مفاهیم در این قالب (ها)، پرس وجوی (پرس وجوهای) متناظر با این قالب ساخته خواهدشد. این پرس وجو (ها) بر روی endpoint مربوطه اجرا می شود تا جواب نهایی به کاربر نمایش داده شود.
علاوه براین، سیستم های پرسش و پاسخ مبتنی بر کلمات کلیدی، تنها پرس وجوهای ساده عطفی را ایجاد می کنند. در روش پیشنهادی، سعی شده است به پرس وجوهای پیچیده (پرسش هایی که به توابع تجمعی، فیلتر کردن و شمارش نیاز دارند) نیز پاسخ داده شود. نتایج ارزیابی نشان از موفقیت قابل قبول سیستم پیشنهادی در مراحل ساخت قالب و ایجاد پرس وجوی نهایی (هر دو نوع پرس وجوی ساده و پیچیده) دارد.
چکیده لاتین
Question Answering systems are some kind of information retrieval systems that instead of retrieving relevant web documents for the user question, try to provide an answer for the question. The input to such a system is either in the form of natural language question or some keywords.
Web based QA systems usually use LOD to extract the answer. Information retrieval based on LOD, can help finding the correct answer with high precision and speed. However, it needs some extra knowledge about underling ontology and the query has to be constructed using formal (and usually complex) languages like SPARQL. On the other hand, the researches have shown that users prefer keyword search for information retrieval. To automate constructing the query, in this thesis we present a novel approach for conversion of keyword queries to SPARQL queries using dynamic templates. Our approach utilizes semantic annotation tools for mapping user keywords into appropriate concepts in the knowledge base. Then, according to type, number of these concepts and templates that are extracted from analyzing similar questions, the final template(s) for user question will be constructed. In the next step, with replacing URIs of concepts in constructed templates, these templates will be converted to SPARQL queries. The constructed query is executed over a SPARQL endpoint to get the answers.
Using this approach, complex SPARQL queries (that need aggregation, filtering or counting) from the keyword queries can be constructed. Evaluations of results demonstrate the success of the proposed system in the process of constructing templates and final queries (both simple and complex queries).