چکیده

          در این مقاله که یک شبکه عصبی کانولوشن عمیق جدید (CNN) که عمیق‌تر و گسترده‎‌تر از شبکه‌های عمیق موجود برای طبقه‌بندی تصویر Hyperspectral است ارائه شده است. برخلاف روش‌های فعلی پیشرفته در طبقه‌بندی تصویر Hyperspectral مبتنی بر CNN، شبکه پیشنهاد شده به نام CNN عمیق متنی، می‌تواند به‌طور مطلوب تعاملات متقابل محتوا را با بهره‌برداری از روابط فضایی-طیفی محلی از بردارهای پیکسل همسایه، بررسی کند. بهره‌برداری مشترک اطلاعات spatio-spectral توسط فیلترکانولوشن چند مقیاسی که به عنوان جزء اولیه خط لوله پیشنهادی CNN مورد استفاده قرار می‌گیرد، به دست می‌آید. ویژگی‌های اولیه فضایی و طیفی نگاشت‌های حاصل از فیلترکانولوشن چند مقیاسی را با هم ترکیب می کنند تا یک ویژگی مشترک فضایی طیفی ایجاد کنند. ویژگی مشترک نشان‌دهنده ویژگی‌های طیفی و فضایی غنی از تصویر Hyperspectral است و سپس از طریق یک شبکه کاملا متقارن تغذیه می‌شود که در نهایت برچسب مربوطه هر pixelvector را پیش‌بینی می‌کند. مجموعه داده‌های استفاده شده در روش پیشنهادی: مجموعه داده‌های Pines هند، مجموعه داده‌های Salinas و مجموعه داده‌های دانشگاه Pavia. مقایسۀ‌ی عملکرد نشان می‌دهد که عملکرد سازگاری پیشرفته در رویکرد پیشنهادی بر روی وضعیت فعلی در سه مجموعه داده نشان داده شده است.

1. مقدمه

         اخیرا، شبکه‌های عصبی کانولوشن عمیق (DCNN) برای طیف گسترده‌ای از وظایف ادراکی بصری مانند تشخیص / طبقه‌بندی شی، تشخیص عمل / فعالیت و غیره مورد استفاده قرار گرفته است. به دنبال موفقیت قابل توجه DCNN در نمایش تصویر / ویدیو، قابلیت‌های منحصر به فرد خود را از استخراج زیر ساختارهای غیرخطی از داده‌های تصویری و همچنین شناخت مقوله‌های محتوای معنایی با بهینه‌سازی پارامترهای چند لایه استخراج می‌کند. اخیرا تلاش‌های بیشتری برای استفاده از روش‌های مبتنی بر یادگیری عمیق برای طبقه‌بندی HEX (HIPS) صورت گرفته است [1] - [8]. با این حال، در حال حاضر مجموعه داده‌های HSI در مقیاس بزرگ در دسترس نیستند، که منجر به فراگیری بهینه DCNN با تعداد پارامترهای زیاد بنا به عدم وجود نمونه‌های آموزش دیده می‌گردد. دسترسی محدود به داده‌های گسترده، رویکردهای مبتنی بر CNN برای طبقه‌بندی HSI [1] - [6]  را از استفاده‌ی شبکه‌های عمیق‌تر و گسترده‌تر منع می‌کند که می‌تواند به‌طور بالقوه بهتر از اطلاعات طیفی و فضایی بسیار غنی موجود در تصاویر hypersepctral استفاده کند.

          از این رو، رویکردهای مدرن و پیشرفته مبتنی بر CNN، بیشتر به استفاده از شبکه‌های کوچک مقیاس با تعداد لایه‌ها و گره‌های نسبتا کمتر در هر لایه برای کاهش هزینه عملکرد تمرکز می‌کنند. عمیق‌تر و گسترده‌تر به معنای استفاده از تعداد نسبتا بیشتری لایه (عمق) و گره در هر لایه (عرض) است. به این ترتیب، کاهش ابعاد طیفی تصویربرداری hypersepctral به طور کلی از طریق تطبیق با تکنیک‌های کم عمق، مانند تجزیه و تحلیل مولفه‌های اصلی (PCA)، تشخیص اختیاری موضعی (BLDE) [3]، تجزیه و تحلیل اختلال محدودیت زوج و اختلاف ناپیوستگی (PCDA-NSD) [10] و غیره است. با این حال، بهره‌برداری از شبکه‌های بزرگ در مقیاس بزرگ، هنوز هم مطلوب است تا به‌طور مشترک از زیرساخت‌های غیرخطی ساختار طیفی و فضایی داده‌های Hyperspectral ساکن در فضای ویژگی‌های چند بعدی استفاده کند. در روش پیشنهادی، قصد داریم یک شبکه عمیق‌تر و وسیع‌تر با توجه به مقادیر محدود داده‌های Hyper-Terra بسازیم که بتواند به‌طور مشترک از اطلاعات طیفی و مکانی هم بهره بگیرد. برای مقابله با مسائل مربوط به آموزش شبکه بزرگ مقیاس در مقدار محدودی از داده‌ها، یک مفهوم به تازگی معرفی شده از "یادگیری وابسته" را به اثبات می‌رسانیم که نشان‌دهنده توانایی قابل توجه برای افزایش قابلیت‌های شبکه‌های بزرگ است. یادگیری وابسته [11] اساس یادگیری زیرگروههای لایه‌ها به نام ماژول‌ها است به‌طوری‌که هر یک از ماژول‌ها  توسط سیگنال وابسته، که تفاوت بین خروجی مورد نظر و ورودی ماژول است بهینه می‌شود، همانطور که در شکل 1a نشان داده شده است، ساختار وابسته از شبکه‌ها باعث افزایش قابل توجهی در عمق و عرض شبکه می‌شود که منجر به افزایش یادگیری و در نهایت بهبود عملکرد تولید می‌شود. بنابراین، شبکه پیشنهاد شده نیاز به پیش پردازش برای کاهش ابعاد داده‌های ورودی ندارد. 

این مقاله در نشریه آی تریپل ای منتشر شده و ترجمه آن با عنوان طبقه‌ بندی عمیق تصویر در سایت ای ترجمه به صورت رایگان قابل دانلود می باشد. جهت دانلود رایگان مقاله فارسی و انگلیسی روی عنوان فارسی (آبی رنگ) کلیک نمایید.
منبع:

Going Deeper with Contextual CNN for Hyperspectral Image Classification