افزایش کیفیت نگاره فرآیندکاوی با استفاده از نگاره پایگاه داده
عنوان لاتین
Increasing quality of process mining event log using the bin log of database
نویسنده
قالیبافان، شکوفه - ghalibafan, shokoufeh
استاد راهنما
کاهانی، محسن
استاد مشاور
بهکمال، بهشید
مقطع تحصیلی
کارشناسی ارشد
سال دفاع از پایان نامه
۱۳۹۵
رشته
مهندسی کامپیوتر - نرم افزار
توصیفگر
فرآیندکاوی
توصیفگر
نگاره رویداد
توصیفگر
هستان نگار
چکیده فارسی
فرآیندکاوی یک زمینه تحقیقاتی نسبتا جدید است که همانند پلی بین داده کاوی، هوش تجاری و مدیریت فرآیندهای کسب وکار قرار دارد. فرآیندکاوی، تکنیکی برای بازسازی فرآیندهای کسب وکار از رویدادهای ثبت شده در سیستم های اطلاعاتی است. هدف اصلی فرآیندکاوی، کشف مدل های فرآیند بر اساس نگاره رویداد می باشد. در واقع، نگاره رویداد نقطه شروع فرآیندکاوی است. برای به دست آوردن نتایج بهتر در فرآیندکاوی، نیاز به نگاره رویداد باکیفیت می باشد؛ بنابراین هرچه کیفیت نگاره رویداد بالاتر باشد، نتایج مناسب تری به دست خواهد آمد.
تکنیک های مختلف فرآیندکاوی در صورتی که نگاره رویداد بی کیفیت را به عنوان ورودی دریافت کنند، نتایج مناسبی را تولید نخواهند کرد. بنابراین یکی از مهم ترین مسائل در حوزه فرآیندکاوی، مدیریت مسائل و چالش های تحلیل نگاره رویداد است که برای موفقیت فرآیندکاوی دارای اهمیت بالایی می باشد. به طور کلی، پیش پردازش نگاره رویداد به عنوان یکی از مسائل کیفیت داده مطرح می گردد.
در روش های موجود که به دو دسته روشهای معنایی و غیرمعنایی تقسیم می شوند، رفع مشکلات نگاره رویداد به صورت عمومی و برای همه تکنیک های فرآیندکاوی انجام نگرفته است. در بیشتر کارهای انجام شده، رفع مشکلات در جهت بهبود تکنیکی خاص و یا به صورت خاص منظوره انجام شده است. در روشی که در این تحقیق ذکر می شود، رفع مشکل داده های ازدست رفته و داده های نادرست در جهت بهبود هر تکنیک فرآیندکاوی انجام می شود.
در روش پیشنهادی این تحقیق، از نگاره باینری پایگاه داده برای اصلاح برخی مشکلات نگاره رویداد و افزایش کیفیت آن، استفاده شده است. همچنین از هستان نگار و تطبیق آن برای رفع مشکل داده های ازدست رفته و داده های نادرست بهره برده شده است.
روش پیشنهادی بر روی فرآیند خرید دانشگاه فردوسی مشهد پیاده سازی شد و مورد ارزیابی قرار گرفت. همچنین روش پیشنهادی با بهترین روش موجود که در دسته روش های معنایی قرار دارد، مقایسه شد و بهبود قابل قبولی را نسبت به روش مورد مقایسه نشان داد. دقت روش پیشنهادی نسبت به روش مورد مقایسه 7% بهبود داشت. همچنین در معیارهای فراخوانی و امتیاز F توانست به ترتیب 37% و 25% بهبود را نسبت به روش مورد مقایسه برای خود به ثبت برساند.
چکیده لاتین
Process mining is a novel discipline relying on both data mining and process modeling. The main idea of process mining is to discover models from event logs. The usefulness of the process models discovered by various techniques depends strongly on the quality of the event logs.
Many researches have been conducted to solve the problem of inappropriate quality event log. Existing approaches are classified into two categories: semantic methods and non-semantic methods. In the proposed semantic approach, solving incorrect data and missing data in event log are considered in order to enhance the quality of every process mining techniques. The bin log of the main database is used to enhance the quality of event log of process mining. Ontology and ontology matching are used for this purpose.
The proposed approach is executed over the procurement process of Ferdowsi University of Mashhad. It was shown that the proposed method had a 5.84% improvement in precision for incorrect data and 7.34% improvement for missing data when compared to the semantic log purging method.