عنوان مقاله:
تشخیص صرع با ورودی الکتروانسفالوگرافی زمان فرکانس ترکیبی: یک رویکرد یادگیری عمیق
Epileptic Seizure Detection with Hybrid Time-Frequency EEG Input: A Deep Learning Approach
سال انتشار: 2022
رشته: مهندسی پزشکی - مهندسی کامپیوتر - بیوتکنولوژی
گرایش: مهندسی پزشکی بالینی - بیوالکتریک - هوش مصنوعی - زیست فناوری پزشکی
دانلود رایگان این مقاله:
مشاهده سایر مقالات جدید:
3. Proposed Epilepsy Classification Method
Different from the aforementioned methods that only use a single representation of the EEG signal, we are interested in combining the information in time domain with information in frequency domain to benefit from the complementarity of both. Meanwhile, considering the general deep learning models in few-shot scenario will induce the undesirable tendency to extremely overfit the data, we try to build our model based on lightweight network to alleviate this tendency. 3.1. Designed Deep Learning Framework for Epilepsy Classification. The block diagram relationship of our designed deep learning model is shown in Figure 1, which can be decomposed into four parts, namely, hybrid input acquisition, feature extraction, feature fusion, and softmax output. The details of our proposed algorithm will be introduced in these four parts. 3.1.1. Hybrid Input Acquisition. In this part, the raw EEG signal was used to calculate the hybrid input format, containing the aforementioned DFT, STFT, and DWT of EEG. In general, signal-domain representation of signal is too limited to distinguish different signals. The main purpose of this part is to transform the time-domain EEG signal to frequency-domain and time-frequency-domain representation, obtaining a rich representative format of EEG signal in different domains. Equations (2)–(5) show the mathematical calculation of hybrid input. 3.1.2. Feature Extraction. Feature extraction is a critical part of the DL-based detection algorithm as the quality of extracted feature will determine the performance of detection. In this paper, CNN is chosen as a feasible scheme for extracting features from the hybrid inputs for two reasons. On the one hand, the scale structure and regional interaction characteristics of CNN are relatively consistent with signals with local characteristics, time-varying character of EEG signal for example. On the other hand, after STFT, the generated two-dimensional spectrogram can be regarded as image actually, motivated by the superior performance of CNN in the field of image recognition; it is proper to adopt CNN to learn the adjacent relation in the two-dimensional image. In this paper, we provide a feasible framework for feature extraction, as shown in Figure 2, where four individual CNNs are used to extract features from their own corresponding input. After several layers of lightweight CNN, feature maps corresponding to each input are generated, followed by global average pooling layers, whose function is transforming the feature maps into feature vectors. It should be noted that the adopted feature extractor can be replaced by other superior neural networks, depending on the selected hybrid input.
4. Results and Discussion
We focus on epilepsy classification using multiple timedomain and frequency-domain information in order to improve the performance of seizure detection. In this section, we first discuss the used EEG dataset, and then, we discuss the performance of our proposed method in few-shot scenario. 4.1. Dataset and Parameter Settings. In this paper, the adopted dataset is acquired online, which is published by Andrzejak et al. [27]. The dataset is composed of five categories, expressed by A, B, C, D, and E. Each category contains 100 recorded EEG signals using a standard 10-20 electrode placement system. The length of each EEG signal is 4097. The samples in category A and category B are collected from five healthy volunteers, and the discrimination between the two categories depends on whether the volunteer is eye opened (A) or eye closed (B). Category C and category D contain the interictal epileptic signals, which are measured on five epilepsy patients. The samples in category C are taken from the hippocampal formation of the opposite hemisphere of the brain while the samples in category D are taken from the epileptogenic zone. Category E records epileptic ictal EEG in the intracranial epileptogenic zone.
(دقت کنید که این بخش از متن، با استفاده از گوگل ترنسلیت ترجمه شده و توسط مترجمین سایت ای ترجمه، ترجمه نشده است و صرفا جهت آشنایی شما با متن میباشد.)
3. روش طبقه بندی صرع پیشنهادی
متفاوت از روشهای فوقالذکر که فقط از یک نمایش واحد از سیگنال EEG استفاده میکنند، ما علاقهمندیم اطلاعات در حوزه زمان را با اطلاعات در حوزه فرکانس ترکیب کنیم تا از مکمل بودن هر دو بهره ببریم. در همین حال، با توجه به اینکه مدلهای یادگیری عمیق عمومی در سناریوی چند شات، تمایل نامطلوب به بیش از حد برازش دادهها را القا میکند، سعی میکنیم مدل خود را بر اساس شبکه سبک وزن بسازیم تا این تمایل را کاهش دهیم. 3.1. طراحی چارچوب یادگیری عمیق برای طبقه بندی صرع. رابطه بلوک دیاگرام مدل یادگیری عمیق طراحی شده ما در شکل 1 نشان داده شده است، که می تواند به چهار بخش، یعنی اکتساب ورودی ترکیبی، استخراج ویژگی، ترکیب ویژگی، و خروجی softmax تجزیه شود. جزئیات الگوریتم پیشنهادی ما در این چهار قسمت معرفی خواهد شد. 3.1.1. جذب ورودی ترکیبی در این بخش از سیگنال EEG خام برای محاسبه فرمت ورودی هیبریدی حاوی DFT، STFT و DWT فوق الذکر EEG استفاده شد. به طور کلی، نمایش سیگنال در دامنه سیگنال برای تشخیص سیگنال های مختلف بسیار محدود است. هدف اصلی این بخش تبدیل سیگنال EEG دامنه زمانی به نمایش دامنه فرکانس و زمان فرکانس دامنه، به دست آوردن یک فرمت نماینده غنی از سیگنال EEG در حوزه های مختلف است. معادلات (2) - (5) محاسبه ریاضی ورودی ترکیبی را نشان می دهد. 3.1.2. استخراج ویژگی. استخراج ویژگی بخش مهمی از الگوریتم تشخیص مبتنی بر DL است زیرا کیفیت ویژگی استخراج شده عملکرد تشخیص را تعیین می کند. در این مقاله، CNN به دو دلیل به عنوان یک طرح امکان پذیر برای استخراج ویژگی ها از ورودی های ترکیبی انتخاب شده است. از یک طرف، ساختار مقیاس و ویژگیهای تعامل منطقهای CNN با سیگنالهایی با ویژگیهای محلی، به عنوان مثال، ویژگی متغیر زمان سیگنال EEG مطابقت دارد. از سوی دیگر، پس از STFT، طیفنگار دو بعدی تولید شده را میتوان بهعنوان تصویر در نظر گرفت که انگیزه آن عملکرد برتر CNN در زمینه تشخیص تصویر است. استفاده از CNN برای یادگیری رابطه مجاور در تصویر دو بعدی مناسب است. در این مقاله، همانطور که در شکل 2 نشان داده شده است، یک چارچوب عملی برای استخراج ویژگی ارائه میکنیم، که در آن از چهار CNN منفرد برای استخراج ویژگیها از ورودی مربوطه خود استفاده میشود. پس از چندین لایه CNN سبک وزن، نقشههای ویژگی مربوط به هر ورودی تولید میشوند و به دنبال آن لایههای ادغام میانگین جهانی ایجاد میشوند که عملکرد آنها تبدیل نقشههای ویژگی به بردارهای ویژگی است. لازم به ذکر است که استخراج کننده ویژگی اتخاذ شده می تواند با سایر شبکه های عصبی برتر بسته به ورودی ترکیبی انتخاب شده جایگزین شود.
4. نتایج و بحث
ما بر طبقه بندی صرع با استفاده از اطلاعات دامنه زمانی و دامنه فرکانس متعدد به منظور بهبود عملکرد تشخیص تشنج تمرکز می کنیم. در این بخش، ابتدا مجموعه داده های EEG مورد استفاده را مورد بحث قرار می دهیم، و سپس، عملکرد روش پیشنهادی خود را در سناریوی چند شات مورد بحث قرار می دهیم. 4.1. مجموعه داده و تنظیمات پارامتر. در این مقاله، مجموعه داده اتخاذ شده به صورت آنلاین به دست آمده است که توسط Andrzejak و همکاران منتشر شده است. [27]. مجموعه داده از پنج دسته تشکیل شده است که با A، B، C، D و E بیان می شود. هر دسته شامل 100 سیگنال EEG ثبت شده با استفاده از یک سیستم قرار دادن الکترود استاندارد 10-20 است. طول هر سیگنال EEG 4097 است. نمونههای دسته A و رده B از پنج داوطلب سالم جمعآوری میشوند و تمایز بین دو دسته بستگی به این دارد که داوطلب با چشم باز (A) یا چشم بسته (B) باشد. رده C و دسته D حاوی سیگنال های صرع بین رحمی هستند که در پنج بیمار صرعی اندازه گیری می شوند. نمونه های دسته C از تشکیل هیپوکامپ نیمکره مخالف مغز و نمونه های دسته D از ناحیه صرع گرفته شده اند. رده E EEG اکتال صرعی را در ناحیه صرع زایی داخل جمجمه ای ثبت می کند.