کیفیت سنجی غیر مخرب و درجه بندی دانه کاکائو به کمک طیف سنجی مادون قرمز نزدیک و تصویربرداری ابرطیفی
عنوان لاتین
Non-destructive quality assessment and sorting of cocoa beans based on near infrared spectroscopy and hyperspectral technology
نویسنده
سعیدان، علی - saeidan, Ali
استاد راهنما
خجسته پور، مهدی
استاد مشاور
معین فرد، مرضیه
مقطع تحصیلی
دکتری (Ph.D)
سال دفاع از پایان نامه
۱۴۰۰
رشته
مهندسی مکانیک بیوسیستم - فناوری پس از برداشت
توصیفگر
تشعشع مادون قرمز
توصیفگر
دانههای کاکائو
توصیفگر
طیفنمایی
توصیفگر
آفلاتوکسین ها
توصیفگر
تصویرنگاری فراطیفی
چکیده فارسی
در تحقیق حاضر از قابلیت طیف سنجی مادون قرمز نزدیک و فناوری تصویربرداری ابرطیفی، برای تشخیص، ارزیابی و درجه بندی تعدادی از پارامترهای کیفی دانه کاکائو استفاده شده است. در بخش اول تحقیق، میزان مواد پلی فنولی و شاخص تخمیر دانه کاکائو مورد ارزیابی قرار گرفت. بدین منظور از دستگاه طیف سنج مادون قرمز در بازه 400 الی 2500 نانومتر استفاده گردید و به منظور ارائه مدل مناسب برای پیش بینی مواد پلی فنولی، تعدادی از پیش تیمارهای مختلف مورد ارزیابی قرار گرفت. از بین این مدل ها، مدل با طیف پیش تیمارشده مشتق دوم ساویتزی گولای، دارای بیشترین میزان ضریب تبیین 9/0 ، ضریب همبستگی 94/0 و خطای 9/1 برای داده های کالیبراسیون و ضریب تبیین 82/0 ، ضریب همبستگی 90/0و خطای 94/1 برای داده های تست معرفی گردید. در پیش بینی شاخص تخمیر نیز مدل PLS ارائه شده با پیش تیمار طیفی مشتق دوم، دارای بیشترین میزان ضریب تبیین 82/0 ، 42/0 ، بیشترین میزان ضریب همبستگی 90/0 و 64/0 و کمترین میزان خطا 06/0 و 17/0 برای داده های کالیبراسیون و تست بود. در بخش دوم تحقیق، از طیف سنجی مادون قرمز نزدیک به عنوان روشی غیرتخریبی و سریع، برای تشخیص دانه های کاکائو آلوده به آفلاتوکسین استفاده شد. دانه های کاکائو با دو غلظت سم (20 ppb و 500ppb) بصورت مصنوعی آلوده شدند و دانه های بدون آلودگی (0 ppb) نیز بصورت سطحی با اتانول پاکسازی گشتند. هر دو دسته دانه های آلوده و سالم با دستگاه طیف سنج و در دامنه 400 الی 2500 نانومتر مورد ارزیابی قرار گرفتند. مدل تجزیه و تحلیل تمایزی حداقل مربعات جزئی (PLS_DA) برای دسته بندی دانه های آلوده و غیر آلوده مورد استفاده قرار گرفت و پیش از آنالیز داده های طیفی، این طیف ها با مشتق مرتبه اول و دوم ساویتزی گولای مورد پیش تیمار قرار گرفتند. نتایج درجه بندی نشان داد که کمترین میزان خطای درجه بندی در حالتی بود که از مشتق مرتبه دوم بعنوان پیش تیمار استفاده شده بود و این مقادیر برای داده های کالیبراسیون، اعتبارسنجی متقابل و تست به ترتیب برابر 00/0˛ 02/0 ˛ 02/0 گزارش شد. همچنین نتایج بررسی نشان داد که دقت جداسازی برای کلاس بدون آلودگی و کلاس با آلودگی بالا بیشتر از دقت جداسازی برای کلاس با آلودگی ppb 20 بود. در بخش نهایی تحقیق به کمک فناوری تصویربرداری ابرطیفی، اقدام به تشخیص و دسته بندی چهار گروه از مواد خارجی (چوب و کاغذ، پلاستیک، سنگ و بقایای اندام های گیاهی) که در صنعت فراوری دانه کاکائو متداول هستند، گردید. بدین منظور داده های تصاویر طیفی 250 نمونه مواد خارجی و دانه کاکائو، با استفاده از تجزیه و تحلیل موئلفه های اصلی و سه مدل طبقه بندی شامل : ماشین های بردار پشتیبان (SVM)، K نزدیک ترین همسایگی نزدیک (KNN) و تجزیه تحلیل تمایزی خطی (LDA) مورد ارزیابی قرار گرفت. طول موج های بهینه بدست آمده از مشتق دوم طیف و همچنین سه مولفه نخست (PCA) بعنوان ورودی وارد مدل های کلاس بند اشاره شده گردید و کارایی این مدل ها با یکدیگر مقایسه گردید. نتایج نشان داد که مدل SVM با ورودی طیف خام بدون پیش پردازش، توانست با بیشترین دقت (10/89 درصد) اقدام به کلاس بندی صحیح نمونه های مواد خارجی و دانه کاکائو کند. دقت این مدل زمانیکه از طول موج های بهینه بعنوان ورودی خود استفاده کرد برابر با 9/86 درصد برای داده های کالیبراسیون و 28/81 درصد برای داده های تست بود. همچنین نتایج این آزمایش نشان داد که برای مجموعه داده های این تحقیق در صورت استفاده از طول موج های بهینه بعنوان ورودی مدل کلاس بند، بازده کلاس بندی می تواند پایدارتر باشد.
چکیده لاتین
In the present study, the capibility of near-infrared spectroscopy and hyperspectral imaging technology have been investigated to detect and evaluate some cocoa bean quality parameters. In the first part of the research, the amount of polyphenolic compounds and cocoa bean fermentation index were evaluated. For this purpose, an infrared spectrometer in the range of 400 to 2500 nm was used and in order to provide a suitable model for predicting polyphenolic materials, a number of different pretreatments were evaluated. Among these models, the model with the pretreated spectrum of the second derivative of Savitzky-Golay, has the highest coefficient of determination 0.9 and error 1.9 for calibration data and coefficient of determination 0.81 and error 1.94 for data test introduced. In predicting the fermentation index, the PLS model presented with the second derivative spectral pretreatment had the highest coefficients of determination 0.82, 0.42 and the lowest error rates of 0.06 and 0.17 for calibration and test data. In the second part of the study, near-infrared spectroscopy was used as a non-destructive method to detect aflatoxin-contaminated cocoa beans. Cocoa beans were artificially contaminated with two concentrations of toxin (20 ppb and 500ppb) and uninfected beans (0 ppb) were superficially purified with ethanol. Both groups of infected and healthy grains were evaluated with a spectrometer in the range of 400 to 2500 nm. The partial least squares discriminant analysis model (PLS_DA) was used to classify infected and non-contaminated grains, and before analyzing the spectral data, these spectra were pretreated with the first and second order derivatives of Savitzky-Golay. The calibration results showed that the lowest calibration error was in the case that the second-order derivative was used as pretreatment and these values for calibration, cross-validation and test data were 0.02 ˛ 0.02, respectively. In the final part of the research, using spectral imaging technology, four groups of foreign materials (wood and paper, plastic, stone and plant organs) that are common in the cocoa bean processing industry were identified and classified. For this purpose, spectral image data of 250 samples of foreign materials and cocoa beans, using principal component analysis and three classification models including: Support Vector Machines (SVM), K Nearest Neighborhood (KNN) and Linear Discrimination Analysis (LDA) were evaluated. The optimal wavelengths obtained from the second derivative of the spectrum as well as the first three components (PCA) were introduced as input into the class models and the performance of these models was compared with each other. The results showed that the SVM model with the input of raw spectrum without preprocessing, was able to correctly classify samples of foreign materials and cocoa beans with the highest accuracy (89.10%). The accuracy of this model when it used the optimal wavelengths as its input was equal to 86.9% for the calibration data and 81.28% for the test data. The results of this experiment also showed that in our data sets, if the optimal wavelengths are used as input to the classification model, the classification efficiency can be more stable.