ارائه یک روش شاخصگذاری مقیاسپذیر و مبتنی بر موجودیت بر روی دادههای RDF
نویسنده
عبیری، فاطمه
استاد راهنما
کاهانی، محسن
مقطع تحصیلی
کارشناسیارشد
سال دفاع از پایان نامه
۱۳۹۲
رشته
کامپیوتر - هوش مصنوعی
توصیفگر
شاخص گذاری
توصیفگر
خوشه بندی
توصیفگر
پرس و جوهای مبتنی بر موجودیت
توصیفگر
پایگاه داده
توصیفگر
پایگاه داده NOSQL
توصیفگر
پایگاه داده HBase
توصیفگر
چارچوب Hadoop
توصیفگر
داده های RDF
چکیده فارسی
ظهور وب معنایی و استقبال گسترده از آن در سالهای اخیر، باعث شده است که توسعهدهند-گان وب، تلاشهای بسیاری را در جهت سازماندهی دادههای معنایی انجام دهند. با افزایش حجم داده-های معنایی، یکی از مهمترین چالشهای موجود در سازماندهی این داده ها، ارائه روشی مقیاسپذیر برای ذخیره و بازیابی آنها است. در این پایاننامه یک روش مقیاس پذیر برای شاخصگذاری دادههای RDF پیشنهاد شده است. از آنجایی که یک سیستم شاخصگذاری از دو بخش ذخیره و بازیابی داده تشکیل میشود، در یک سیستم شاخصگذاری مقیاسپذیر، علاوه بر ذخیرهی دادههای حجیم RDF، فرایند بازیابی دادهها را نیز باید به طور موثری برای کاربران مهیا نمود. به منظور ایجاد مقیاسپذیری در روش شاخصگذاری پیشنهادی، از پایگاهدادهی HBase که یکی از پایگاهدادههای NOSQL است، استفاده شده است. HBase با فراهم نمودن امکان دسترسی تصادفی به داده های حجیم روی چارچوب توزیع شده Hadoop میتواند گزینه مناسبی برای مدیریت دادههای حجیم وب باشد. همچنین طبق آمارهای اخیر، اکثر کاربران در پرسوجوهای خود به دنبال یک موجودیت با مجموعه صفات مشخص هستند. در روش پیشنهادی، هدف پاسخگویی موثر به این نوع از پرسو جوها است. از این رو یک الگوریتم خوشه بندی جهت گروهبندی موجودیتهای مشابه، ارائه شده است و به ازای هر یک از خوشههای بدستآمده، یک جدول در پایگاهداده ایجاد میشود. نتایج ارزیابی نشان می-دهد که روش پیشنهادی در بازیابی دادههای RDF موفق بوده است.