چکیده
کلان داده به دادههایی با حجم زیاد، از اگزابایت (1018) و بیشتر از آن، گویند. این حجم از داده، از ظرفیت سیستمهای پردازشی و سیستمهای ذخیره آنلاین فعلی بیشتر است. داده ، اطلاعات و دانش در نرخی تولید و جمع آوری میشوند که خیلی سریع به حجم اگزابایت /سال میرسند. ایجاد و جمع آوری روز به روز سریعتر میشود و در طی چند سال به دامنه زتابایت /سال میرسند. حجم ، تنها یک جنبه کلان داده است، صفات دیگر، تنوع ، سرعت ، ارزش و پیچیدگی هستند. ذخیره و انتقال داده مسائل مربوط به تکنولوژی هستند، که به نظر میرسد که در آینده نزدیک به مشکلات آنها رسیدگی میشود، اما چالشهای بلند مدتی را نشان میدهند که نیازمند پارادایمهای جدید و پژوهش است. ما مسائل و چالشها را با شروع یک برنامه پژوهشی همکارانه بر متدلوژیهایی برای طراحی و تحلیل کلان داده آغاز کردیم.