چکیده  
            تخمین و پیش بینی حجم ترافیک شبکه موضوع تحقیقاتی مهمی است که توجه مداوم انجمن شبکه و انجمن یادگیری ماشین را جلب کرده است. اگر چه کار زیادی بر روی تخمین و پیش بینی ماتریس ترافیک با استفاده از مدل های سری زمانی، تجزیه ماتریس با رنک پایین وجود دارد، بر اساس آنچه ما و همکاران می دانیم کارهای کمی برای بررسی این مسئله که آیا ما می توانیم حجم شبکه مبتنی بر برخی آمارگان (آماره های) های ترافیک که جمع آوری آنها، کم هزینه تر هستند مانند جریان شمارش flow count ، تخمین زده یا پیش بینی کنیم. در این مقاله، مدلی برای ارتباط بین حجم ترافیک و آمارگان (آماره های) های ساده  مانند جریان flows با استفاده مدل پنهان مارکف پیشنهاد می دهیم که بر اساس آن می توانیم از اندازه گیری مستقیم حجم داده اجتناب کنیم اما در عوض حجم ترافیک پنهان شده مبتنی بر آن آمارگان (آماره های) ساده جریان flow که به وسیله برخی تکنیک‌های طراحی جمع آوری شده اند، تخمین زده و پیش بینی کنیم. سادگی و تاثیرگذاری روش پیشنهادی را با استفاده از تعدادی شبه شبیه سازی و نتایج تجربی حاصل از داده واقعی نشان می دهیم.

1. مقدمه
              تخمین و پیش بینی حجم ترافیک شبکه  یک مسئله مهم تحقیقاتی شبکه است. تخمین و پیش بینی دقیق  حجم ترافیک ، به ویژه ماتریس ترافیک ، برای کنترل مسیریابی شبکه ، کنترل ازدحام ، تخصیص منابع شبکه و برنامه ریزی بلند مدت سودمند است و به این ترتیب در انجمن شبکه و انجمن یادگیری ماشین توجه زیادی را به خود جلب کرده است. در کارهای موجود عمدتا دو جریان اصلی از تحقیق وجود دارد. جریان اصلی اول فرض می کند که در هر بازه زمانی مشخص ، حجم ترافیک مجموع  (تعداد بایت) بین یک جفت منبع مقصد معین که می تواند اندازه گیری شود، اتفاق می افتد و سپس یک مدل آنالیز سری زمانی مانند مدل های خطی شامل AR ، ARMA، ARIMA ، FARIMA [6] ، [7] ، [16] ، [14] و مدل های غیر خطی شامل ANN ، RNN ، GARCH [10]، [17] ، [2]، [8] برای پیش بینی ترافیک آینده استفاده شده است. محدودیت این دسته از رویکردها این است که لازم است به طور مستقیم حجم ترافیک بازه های زمانی قبلی را به منظور پیش بینی حجم های ترافیک برای بازه زمانی آینده اندازه گیری نماییم. با این وجود، اندازه گیری مستقیم حجم داده برای عملی شدن به ویژه در شبکه با سرعت خیلی بالا  بسیار هزینه بر است، و بنابراین اگرچه این رویکرد ساده است اما در عمل، مقیاس‌پذیر نیست. مسیر اصلی دیگر رویکردها معمولاً توموگرافی شبکه نامیده می شوند [3] ، [1] ، [9] ، [4] که مکمل اولین رویکرد مسیر اصلی است. ایده توموگرافی شبکه برای  تخمین حجم ترافیک شبکه مبتنی بر مشاهدات دیگری مانند استفاده از لینک link utilization است. استفاده از لینک link utilization ، حجم ترافیک مجموع از جریان هایی flow است که از طریق آن لینک عبور می کنند. در نتیجه، معمولاً یک سیستم خطی معین (قطعی) برای توصیف رابطه بین کاربرد لینک و حجم ترافیک پنهان وجود دارد. با این حال ، یکی از محدودیت های مهلک رویکرد توموگرافی شبکه این است که سیستم خطی همیشه نامعین است زیرا در یک شبکه تعداد لینک ها به مراتب کمتر از تعداد جفت های منبع مقصد است. بازیابی حجم ترافیک پنهان با استفاده ازمقدار محدودی از استفاده در لینک link utilizations بسیار دشوار است.
              در این مقاله ، با توجه به محدودیت های قوی در کارهای موجود، احتمال حدس زدن حجم ترافیک را بر اساس برخی آمارگان (آماره های) های جریان مانند تعداد جریان های بازه زمانی معین که جمع آوری بسیار راحت تری دارند را بررسی می کنیم. می دانیم، کار ما در استخراج وابستگی بین شمارش های جریان flow count و حجم جریان به منظور تخمین و پیش بینی حجم ترافیک، پیشگام است. پیشنهاد می کنیم از مدل پنهان مارکف برای تشریح ارتباط شمارش جریان flow count و حجم جریان و هم چنین رفتار پویای موقت هر دو استفاده کنیم. ما از الکوریتم های بسیار جدیدی مانند قانون کرنل بیز و شبکه های عصبی بازگشتی با واحد حافظه طولانی کوتاه مدت (واحد LSTM) برای آموزش مدل و استفاده از مدل برای پیش بینی ترافیک آینده استفاده می کنیم.

این مقاله در نشریه آی تریپل ای منتشر شده و ترجمه آن با عنوان  پیش بینی ترافیک آینده در سایت ای ترجمه به صورت رایگان قابل دانلود می باشد. جهت دانلود رایگان مقاله فارسی و انگلیسی روی عنوان فارسی (آبی رنگ) کلیک نمایید.
منبع:

Predicting Future Traffic using Hidden Markov Models