فایل این پایان نامه تا تاریخ 1396/01/01 قابل مشاهده نیست
عنوان
تعیین شباهت فرآیند ها با استفاده از شباهت درختی
عنوان لاتین
Process Similarity Assessment Using Tree Similarity
نویسنده
سخدری، جلال - sakhdari, jalal
استاد راهنما
کاهانی، محسن
استاد مشاور
ابریشمی، سعید
مقطع تحصیلی
کارشناسی ارشد
سال دفاع از پایان نامه
۱۳۹۵
رشته
مهندسی کامپیوتر - نرم افزار (مجازی)
توصیفگر
فرآیندکاوی
توصیفگر
شباهت درختی فرایندها
توصیفگر
شباهت فرآیندی
چکیده فارسی
در سال های اخیر، علم داده ها به عنوان یک رشته جدید و مهم ظهور نموده است. فرآیندکاوی بخش جدایی ناپذیر علم داده ها است. تکنیک های فرآیندکاوی، قادر به استخراج دانش از نگاره های رویداد موجود در سامانه های اطلاعاتی امروزی هستند. یکی از حوزه های محبوب فرآیند کاوی تعیین شباهت فرآیندها است. برای این منظور، مدل نمونه فرآیندهای فعال از مستندات سازمان استخراج و با مدل اصلی به روش شباهت فرآیندی مقایسه می شوند.
پژوهش های زیادی در حوزه شباهت فرآیند ی انجام شده و راه کارهای مختلفی نیز پیشنهاد شده اند. پژوهش های صورت گرفته در این حوزه، شامل روش های مبتنی بر ساختار، مبتنی بر رفتار و مبتنی بر اطلاعات گره ها و یال ها هستند. چالش اصلی در این روش ها این است که نوع گره های سازه (AND، XOR) در هنگام محاسبه شباهت در نظر گرفته نمی شوند. همچنین در اکثر روش های پیشنهادی، حلقه ها به دلایل مختلفی (ازجمله دنباله های اجرای نامتناهی، مرتبه زمانی نمایی) نادیده گرفته شده اند. این درحالی است که حلقه ها در رفتار خروجی فرآیند ها بسیار مؤثر هستند. روش پیشنهادی مدل فرآیند استخراج شده از فایل نگاره یا خود فایل نگاره را به درخت فرآیند تبدیل نموده و شباهت را بر مبنای آن محاسبه می کند. چالش دیگر این است که برخی از روش ها فقط مدل فرآیند و برخی دیگر فقط فایل نگاره را مبنا قرار می دهند. روش پیشنهادی هم روی مدل فرآیند و هم روی فایل نگاره قابل استفاده است. برخی از روش ها معنا را نیز دخیل کرده و به نتایج خوبی دست یافته اند. چالش اصلی در این روش ها وابستگی آن ها به ساخت هستان نگار برای زمینه موردنظر می باشند.
روش پیشنهادی روی داده های بیمارستان دانشگاهی در هلند پیاده سازی و ارزیابی شد. نتایج نشان داد که این روش صحت و کمال مناسبی را نسبت به روش نحوی دارد. همچنین در مقایسه با روش هستان نگار دارای نتایج مناسبی است، ضمن این که نیازی به استخراج هستان نگار ندارد. مرتبه زمانی مناسب تری نسبت به روش نگاشت هستان نگار مورد مقایسه داشته و برخی از مشکلات آن را نیز برطرف نموده است.
کلید واژه ها: فرآیند کاوی، فایل نگاره، شباهت فرآیندی، مدل فرآیند، شباهت درختی فرآیند ها، روش های ساختاری
چکیده لاتین
In recent years, scientific data have emerged as an important new field. Process mining is an integral part of data science. Process mining techniques try to extract knowledge from today existing information systems event logs. One of the popular areas of process mining is process similarity, in which the model of active process variants extracted from the event logs is compared with the original model using similarity methods.
Many studies conducted in process similarity and different solutions have been proposed. Research conducted in this field includes structure-based methods, behavior-based methods and the activity lable-based mthods. The main challenge of the previous methods is that the type of connection node (AND, XOR) has not been considered when calculating the similarities. Also, in most of the proposed methods, loops in the process have been ignored. The proposed approach initially converts the extracted process model from the event logs or the raw event log to the process tree and then tries to measure the similarity of the trees.
The proposed approach was implemented and evaluated using Dutch academic hospital event log. The results showed that this approach achieved 81.33% for correntess and 88% for completeness., which can be considered to be better than most approaches
Keywords: Process mining, event log, process similarity, process model, process tree