چکیده
کلان داده به دادههایی با حجم زیاد، از اگزابایت (1018) و بیشتر از آن، گویند. این حجم از داده، از ظرفیت سیستمهای پردازشی و سیستمهای ذخیره آنلاین فعلی بیشتر است. داده ، اطلاعات و دانش در نرخی تولید و جمع آوری میشوند که خیلی سریع به حجم اگزابایت /سال میرسند. ایجاد و جمع آوری روز به روز سریعتر میشود و در طی چند سال به دامنه زتابایت /سال میرسند. حجم ، تنها یک جنبه کلان داده است، صفات دیگر، تنوع ، سرعت ، ارزش و پیچیدگی هستند. ذخیره و انتقال داده مسائل مربوط به تکنولوژی هستند، که به نظر میرسد که در آینده نزدیک به مشکلات آنها رسیدگی میشود، اما چالشهای بلند مدتی را نشان میدهند که نیازمند پارادایمهای جدید و پژوهش است. ما مسائل و چالشها را با شروع یک برنامه پژوهشی همکارانه بر متدلوژیهایی برای طراحی و تحلیل کلان داده آغاز کردیم.
1. مقدمه
مفهوم کلان داده در علوم کامپیوتر از روزهای اولیه کامپیوتر شایع بوده است. "کلان داده" در اصل به معنی حجمی از داده است که نمیتواند (به صورت کارامدی) توسط ابزارها و متدهای پایگاه داده سنتی پردازش شود. هر بار که یک رسانه ذخیره سازی جدید اختراع میشود، مقدار داده قابل دسترسی بیش از حد میشود، چرا که این رسانهها به سادگی قابل دسترسی هستند. تعریف اصلی بر داده ساختار یافته متمرکز است، اما بیشتر پژوهشگران و متخصصان متوجه شده اند که بیشتر اطلاعات جهان به صورت اطلاعات ساختارنیافته و حجیم، و تا حدی در فرم متن و تصویر در دسترس هستند. انفجار داده ربطی به رسانهها ذخیره سازی جدید ندارد.
ما "کلان داده" را به عنوان مقداری داده تعریف میکنیم که از نظر ذخیره، مدیریت و پردازش کارآمد فراتر از قابلیت تکنولوژی است. موارد گفته شده تنها توسط یک تحلیل قوی بر خود داده، بیان نیازهای پردازشی، و قابلیتهای ابزارهای (سخت افزار، نرم افزار و متدهای) استفاده شده برای تحلیل آن، کشف شده است. با بوجود آمدن هر مشکل جدید، نتیجه چگونگی ادامه دادن ممکن است به این توصیه منجر شود که برای اجرای وظایف جدید باید ابزارهای جدیدی داشته باشیم.
این مقاله در نشریه آی تریپل ای منتشر شده و ترجمه آن با عنوان چالش های کلان داده در سایت ای ترجمه به صورت رایگان قابل دانلود می باشد. جهت دانلود رایگان مقاله فارسی و انگلیسی روی عنوان فارسی (آبی رنگ) کلیک نمایید.
منبع: