رتبه بندی نتایج پرس وجوهای SPARQL بر مبنای تحلیل پیوند و محتوا
عنوان لاتین
Ranking SPARQL Query Results via Content and Link Analysis
نویسنده
فیض نیا، اعظم - Feyznia, Azam
استاد راهنما
کاهانی، محسن
مقطع تحصیلی
کارشناسی ارشد
سال دفاع از پایان نامه
۱۳۹۳
رشته
مهندسی کامپیوتر - نرم افزار
توصیفگر
پیوندها
توصیفگر
تحلیل محتوا
توصیفگر
رتبه بندی
توصیفگر
موتورهای جستجو
توصیفگر
وب معنایی
توصیفگر
پرسش ها
چکیده فارسی
حجم بالا و رو به رشد داده های پیوندی منتشر شده در وب، بر اهمیت موتورهای جستجوی وب معنایی برای بازیابی اطلاعات مورد نیاز کاربران افزوده است. کاربران معمولا از بین نتایج بازگردانده شده، تنها چند نتیجه ی اول را مورد بررسی قرار می دهند. لذا، ترتیب نمایش نتایج و انتخاب الگوریتم رتبه بندی مناسب، تاثیر زیادی در میزان رضایت کاربران از موتور جستجو دارد. ساخت یافتگی داده های وب معنایی این امکان را فراهم کرده است که کاربران بتوانند براساس پرس وجوهای ساختیافته و دقیق SPARQL به جستجوی وب بپردازند. بنابراین برخلاف وب اسناد که در آن، جستجو تنها براساس پرس وجوی کلمهی کلیدی ممکن بود، در موتورهای جستجوی وب معنایی امکان پاسخ به پرس وجوهای غیرمبهم SPARQL نیز فراهم شده است.
روش های رتبه بندی که تاکنون برای نتایج پرس وجوهای SPARQL ارائه شده اند، تنها با استفاده از الگوریتم های تحلیل پیوند، رتبه ی محبوبیت نتایج را محاسبه می کنند. در این پایان نامه، یک روش جدید رتبه بندی برای نتایج پرس وجوهای SPARQL ارائه شده است که میزان ارزشمند بودن هر پاسخ را براساس ترکیب رتبه های محبوبیت و مرتبط بودن اندازه گیری می کند. در روش پیشنهادی، رتبه ی محبوبیت از طریق تعمیم الگوریتم رتبه بندی PageRank روی گراف دو لایه از منابع داده و اسناد معنایی و تخصیص خودکار وزن به پیوندهای معنایی مختلف، محاسبه می شود. رتبه ی مرتبط بودن، از طریق تحلیل محتوای اسناد معنایی و پرس وجوهای SPARQL اندازه گیری می شود. نتایج حاصل از ارزیابی نشان میدهد که مدل داده ی پیشنهادی متناسب با ویژگی گرافی پرس وجوهای SPARQL بوده و در محاسبه ی رتبه ی نتایج پرس وجوهای SPARQL موفق است و رتبه بندی براساس ترکیب رتبه های محبوبیت و مرتبط بودن، باعث بهبود دقت رتبه بندی میشود.
چکیده لاتین
The growing amount of Linked Data makes semantic web search engines more important to help users in retrieving information. Users often examine the first few results among all the returned results. Therefore, using an appropriate ranking algorithm has a great effect on user satisfaction.
Structured data has enabled users to search semantic web, based on SPARQL queries. Therefore, unlike web search engines that enable users to search the web only by keyword-based queries, the semantic web search engines have provided utilities to be able to answer SPARQL queries in addition to keyword-based queries.
The previous methods for ranking SPARQL query results are based on popularity calculation and do not calculate the relevance of results to the SPARQL query. However, the proposed ranking method of this dissertation calculates both relevancy and popularity ranks for SPARQL query results via content and link analysis, respectively. It calculates the popularity rank by generalizing PageRank method on a graph with two layers; data sources and semantic documents. The proposed method also assigns weights automatically to different semantic links. Further, the relevancy rank is based on the relevance of semantic documents with SPARQL query. The evaluation results show that the proposed data model is successful in calculating the rank score of SPARQL query result graphs. Furthermore, ranking SPARQL query results by combining relevancy and popularity scores of them, can improve the accuracy of ranking method in comparison to the methods that are only based on popularity calculation.