چکیده
در این مقاله که یک شبکه عصبی کانولوشن عمیق جدید (CNN) که عمیقتر و گستردهتر از شبکههای عمیق موجود برای طبقهبندی تصویر Hyperspectral است ارائه شده است. برخلاف روشهای فعلی پیشرفته در طبقهبندی تصویر Hyperspectral مبتنی بر CNN، شبکه پیشنهاد شده به نام CNN عمیق متنی، میتواند بهطور مطلوب تعاملات متقابل محتوا را با بهرهبرداری از روابط فضایی-طیفی محلی از بردارهای پیکسل همسایه، بررسی کند. بهرهبرداری مشترک اطلاعات spatio-spectral توسط فیلترکانولوشن چند مقیاسی که به عنوان جزء اولیه خط لوله پیشنهادی CNN مورد استفاده قرار میگیرد، به دست میآید. ویژگیهای اولیه فضایی و طیفی نگاشتهای حاصل از فیلترکانولوشن چند مقیاسی را با هم ترکیب می کنند تا یک ویژگی مشترک فضایی طیفی ایجاد کنند. ویژگی مشترک نشاندهنده ویژگیهای طیفی و فضایی غنی از تصویر Hyperspectral است و سپس از طریق یک شبکه کاملا متقارن تغذیه میشود که در نهایت برچسب مربوطه هر pixelvector را پیشبینی میکند. مجموعه دادههای استفاده شده در روش پیشنهادی: مجموعه دادههای Pines هند، مجموعه دادههای Salinas و مجموعه دادههای دانشگاه Pavia. مقایسۀی عملکرد نشان میدهد که عملکرد سازگاری پیشرفته در رویکرد پیشنهادی بر روی وضعیت فعلی در سه مجموعه داده نشان داده شده است.
1. مقدمه
اخیرا، شبکههای عصبی کانولوشن عمیق (DCNN) برای طیف گستردهای از وظایف ادراکی بصری مانند تشخیص / طبقهبندی شی، تشخیص عمل / فعالیت و غیره مورد استفاده قرار گرفته است. به دنبال موفقیت قابل توجه DCNN در نمایش تصویر / ویدیو، قابلیتهای منحصر به فرد خود را از استخراج زیر ساختارهای غیرخطی از دادههای تصویری و همچنین شناخت مقولههای محتوای معنایی با بهینهسازی پارامترهای چند لایه استخراج میکند. اخیرا تلاشهای بیشتری برای استفاده از روشهای مبتنی بر یادگیری عمیق برای طبقهبندی HEX (HIPS) صورت گرفته است [1] - [8]. با این حال، در حال حاضر مجموعه دادههای HSI در مقیاس بزرگ در دسترس نیستند، که منجر به فراگیری بهینه DCNN با تعداد پارامترهای زیاد بنا به عدم وجود نمونههای آموزش دیده میگردد. دسترسی محدود به دادههای گسترده، رویکردهای مبتنی بر CNN برای طبقهبندی HSI [1] - [6] را از استفادهی شبکههای عمیقتر و گستردهتر منع میکند که میتواند بهطور بالقوه بهتر از اطلاعات طیفی و فضایی بسیار غنی موجود در تصاویر hypersepctral استفاده کند.
از این رو، رویکردهای مدرن و پیشرفته مبتنی بر CNN، بیشتر به استفاده از شبکههای کوچک مقیاس با تعداد لایهها و گرههای نسبتا کمتر در هر لایه برای کاهش هزینه عملکرد تمرکز میکنند. عمیقتر و گستردهتر به معنای استفاده از تعداد نسبتا بیشتری لایه (عمق) و گره در هر لایه (عرض) است. به این ترتیب، کاهش ابعاد طیفی تصویربرداری hypersepctral به طور کلی از طریق تطبیق با تکنیکهای کم عمق، مانند تجزیه و تحلیل مولفههای اصلی (PCA)، تشخیص اختیاری موضعی (BLDE) [3]، تجزیه و تحلیل اختلال محدودیت زوج و اختلاف ناپیوستگی (PCDA-NSD) [10] و غیره است. با این حال، بهرهبرداری از شبکههای بزرگ در مقیاس بزرگ، هنوز هم مطلوب است تا بهطور مشترک از زیرساختهای غیرخطی ساختار طیفی و فضایی دادههای Hyperspectral ساکن در فضای ویژگیهای چند بعدی استفاده کند. در روش پیشنهادی، قصد داریم یک شبکه عمیقتر و وسیعتر با توجه به مقادیر محدود دادههای Hyper-Terra بسازیم که بتواند بهطور مشترک از اطلاعات طیفی و مکانی هم بهره بگیرد. برای مقابله با مسائل مربوط به آموزش شبکه بزرگ مقیاس در مقدار محدودی از دادهها، یک مفهوم به تازگی معرفی شده از "یادگیری وابسته" را به اثبات میرسانیم که نشاندهنده توانایی قابل توجه برای افزایش قابلیتهای شبکههای بزرگ است. یادگیری وابسته [11] اساس یادگیری زیرگروههای لایهها به نام ماژولها است بهطوریکه هر یک از ماژولها توسط سیگنال وابسته، که تفاوت بین خروجی مورد نظر و ورودی ماژول است بهینه میشود، همانطور که در شکل 1a نشان داده شده است، ساختار وابسته از شبکهها باعث افزایش قابل توجهی در عمق و عرض شبکه میشود که منجر به افزایش یادگیری و در نهایت بهبود عملکرد تولید میشود. بنابراین، شبکه پیشنهاد شده نیاز به پیش پردازش برای کاهش ابعاد دادههای ورودی ندارد.
این مقاله در نشریه آی تریپل ای منتشر شده و ترجمه آن با عنوان طبقه بندی عمیق تصویر در سایت ای ترجمه به صورت رایگان قابل دانلود می باشد. جهت دانلود رایگان مقاله فارسی و انگلیسی روی عنوان فارسی (آبی رنگ) کلیک نمایید.
منبع:
Going Deeper with Contextual CNN for Hyperspectral Image Classification