سیستم تشخیص نفوذ با استفاده از یادگیری عمیق در بستر داده های عظیم
عنوان لاتین
Intrusion detection system using deep learning over big data infrastructure
نویسنده
نادری میقان، سوسن - naderi, soosan
استاد راهنما
کاهانی، محسن
مقطع تحصیلی
کارشناسی ارشد
سال دفاع از پایان نامه
۱۳۹۷
رشته
مهندسی کامپیوتر - نرم افزار
توصیفگر
تشخیص نفوذ فازی
توصیفگر
یادگیری عمیق
توصیفگر
یادگیری ماشین
چکیده فارسی
از آنجایی که حجم داده ها روز به روز در حال افزایش است و ترافیک شبکه با سرعت تولید می شود، با ایجاد راه حلی برای رفع این قبیل مشکلات می توان بهبودی در سیستم های تشخیص نفوذ فعلی برقرار کرد. در نتیجه در این تحقیق به دنبال روشی برای تشخیص نفوذ هستیم که برای حجم زیاد داده مناسب باشد، به گونه ای که با ساختار داده های بزرگ سازگار بوده و قابلیت مقیاس پذیری و توزیع پذیری آن نیز مورد توجه می باشد. همچنین با به کارگیری روش های یادگیری عمیق برای یادگیری ویژگی های پنهان و ترکیب آن با ساختار داده های عظیم سعی در بهبود زمان مصرفی و دقت تشخیص نیز می شود. هدف این تحقیق مقابله با مشکلات پردازش حجم زیاد داده های امنیتی برای تشخیص نفوذ است. در این تحقیق از Apache Spark که ابزاری برای پردازش داده های عظیم است استفاده شده تا حجم زیاد ترافیک شبکه را پردازش کند. همچنین ما تلاش کردیم در این تحقیق روشی ترکیبی پیشنهاد دهیم تا از مزایای شبکه عمیق و روش های یادگیری ماشین استفاده کنیم. ابتدا از شبکه Stacked Autoencoder برای استخراج ویژگی های پنهان استفاده کردیم، سپس از چندین روش تشخیص نفوذ مبتنی بر طبقه بندی از قبیل ماشین بردار پشتیبانی، جنگل تصادفی، درخت تصمیم و naïve bayes استفاده کردیم. این روش ترکیبی سرعت تشخیص نفوذ در حجم زیاد ترافیک شبکه را افزایش می دهد. مجموعه داده استفاده شده در این تحقیق مجموعه داده UNB ISCX 2012 است. ما برای ارزیابی کارایی روش پیشنهادی خود از معیارهای صحت، دقت، حساست، معیار F و زمان اجرا استفاده کردیم.
چکیده لاتین
As the volume of data is increasing and network traffic is speeding up, we can improve intrusion detection systems by creating the solution to these problems. So, our goal in this research is looking for the solution which is appropriate for big data. The solution should be compatible with the large data structure and its scalability and distributability are also considered. Also, using deep learning methods to learn hidden features and combining them with the huge data structure is also trying to improve the time consumed and the accuracy of the diagnosis. This paper successfully tackles the problem of processing a vast amount of security related data for the task of network intrusion detection. It employs Apache Spark, as a big data processing tool, for processing a large size of network traffic data. Also, we propose a hybrid scheme that combines the advantages of deep network and machine learning methods. Initially, Stacked Autoencoder network is used for latent feature extraction, which is followed by several classification based intrusion detection methods; support vector machine, random forest, decision trees and naive bayes are used for fast and efficient detection of intrusion in massive network traffic data. A real time UNB ISCX 2012 dataset is used to validate our proposed method and the performance is evaluated in terms of accuracy, f-measure, sensitivity, precision and time.