چکیده
در یک دسته بندی SVM (ماشین بردار پشتیبان) افزایشی، داده های با بردارهای غیر پشتیبان عنوان بندی می-شوند( لیبل گذاری) که توسط دسته قبلی به عنوان داده های تمرینی در دسته بعدی همراه با داده های تایید شده توسط شرط KarusheKuhneTucker (شرایط کان تاکر) مورد استفاده قرار گرفته می شوند. این مقاله استراتژی نیمه تقسیم بندی انتخاب و حفظ بردارهای غیرپشتیبان از افزایش فعلی دسته بندی- که به عنوان بردارهای پشتیبان مناسب نامگذاری شدند(CSV)- را پیشنهاد می دهد که به احتمال زیاد به بردارهای پشتیبان در توسعه دسته بعدی تبدیل می شوند. همچنین این کار تحقیقاتی الگوریتمی را طراحی می کند که به عنوان بردار پشتیبان مناسب نامگذاری می شود که براساس الگوریتم SVM (CSV-ISVM) افزایشی می باشد به طوریکه استراتژی پیشنهادی را پیاده سازی می کند و کل فرایند دسته بندی SVM افزایشی تحقق می بخشد. این کار نیز تغییراتی را برای روش حلقه متمرکز پیشنهاد شده قبلی و استراتژی دسته معکوس پیشنهاد می دهد. عملکرد روش پیشنهادی با آزمایشات و همچنین مقایسه آن با تکنیکهای SVM دیگر ارزیابی می شود. نتایج تجربی و تحلیل عملکرد نشان می دهند که برای کشف نفوذ شبکه در زمان واقعی الگوریتم پیشنهادی CSV-ISVM از دسته بندی-های کلی ISVM بهتر می باشد.
1- معرفی
تشخیص نفوذ شبکه به عنوان یک طرح تشخیص مشکل برای طبقه بندی الگوهای ترافیک شبکه در دو کلاس –نرمال و غیرنرمال- در نظر گرفته می شود؛ باتوجه به شباهت بین آنها. امروزه در زمینه تشخیص نفوذ، ماشین بردار پشتیبان (svm) تبدیل به یک ابزار طبقه بندی محبوب شده است که براساس فراگیری ماشین آماری می باشد (Mohammad et al., 2011). دو موضوع در فراگیری-تمرین ماشین برای مجموعه داده های بزرگ و در دسترس پذیری یک مجموعه داده کامل وجود دارد. اگر مجموعه داده های تمرینی بسیار بزرگ باشند حافظه کامپیوتر کافی نخواهد بود و زمان تمرین بسیار طولانی خواهد بود. سپس، وقتی ما بسته های داده را از یک جریان شبکه می گیریم، ما نمی توانیم اطلاعات کامل شبکه را در اولین فرصت به دست آوریم و بنابراین با افزایش تعداد نمونه ها، یک فراگیری آنلاین مستمر برای بالابردن دقت موردنیاز می باشد. چالش فراگیری افزایشی برای این است تا تصمیم بگیریم که چه چیزی و چه میزان اطلاعات از فراگیری قبلی باید برای تمرین در مرحله فراگیری بعدی انتخاب شود و چگونه با مجموعه داده های جدیدی که در آن مرحله اضافه می شوند باید رفتار کرد. بنابراین کلید فراگیری افزایشی این است که با مجموعه داده های اضافه شده مقابله کنیم بطوریکه اطلاعات نمونه داده اصلی ضمنا حفظ شود.
اکثر روشهای تشخیص نفوذ از الگوریتمهای فراگیری غیر افزایشی استفاده می کنند. با جمع آوری نمونه داده های جدید، زمان تمرین شان مداوم افزایش می یابد، و در همان زمان، آنها مشکلاتی در تنظیم خودشان با تغییرات محیط شبکه دارند. در این مورد، فراگیری افزایشی این قابلیت را دارد که از نمونه های جدید سریع یادبگیرد و مدل اصلی خودشان را اصلاح کنند. روشهای فراگیری افزایشی می توانند بهتر نیازهای تشخیص نفوذ در زمان واقعی را برآورده کرده، و همچنین دقت محاسباتی برنامه های زمان حقیقی را می توانند بهبود بخشند.
این مقاله در نشریه الزویر منتشر شده و ترجمه آن با عنوان بردارهای پشتیبان در سایت ای ترجمه به صورت رایگان قابل دانلود می باشد. جهت دانلود رایگان مقاله فارسی و انگلیسی روی عنوان فارسی (آبی رنگ) کلیک نمایید.
منبع:
Selection of Candidate Support Vectors in incremental SVM for network intrusion detection