چکیده
یادگیری ماشین (ML) بهطور مداوم قدرت خود را در طیف گستردهای از برنامههای کاربردی نشان میدهد. این مسئله در سال های اخیر تا حدودی با توجه به ظهور دادههای بزرگ بیشتر مورد توجه قرار گرفته است. الگوریتم ML هرگز بهترین عملکرد خود را نداشت تا اینکه توسط دادههای بزرگ به چالش کشیده شد. دادههای بزرگ، الگوریتم ML را قادر به کشف الگوهای دقیقتر و پیشبینی به موقع تر و دقیق تر از قبل کردند. از سوی دیگر، چالشهای بزرگی در ML مانند مقیاسپذیری مدل و محاسبات توزیع شده مطرح کرد. در این مقاله، یک چارچوب از ML در دادههای بزرگ (MLBiD) برای هدایت بحث به فرصتها و چالشهای آن معرفی خواهد شد. چارچوب ML محور، شامل مراحل پیش پردازش، یادگیری و ارزشیابی است. علاوه براین، چارچوب شامل چهار جزء دیگر، مانند دادههای بزرگ، کاربران، دامنه و سیستم است. مراحل ML و اجزای MLBiD برای شناسایی فرصتهای مرتبط و چالشها و روشن کردن مسیر کاری آینده در بسیاری از موارد ناشناخته و یا در پژوهش حاضر ارائه شده است.
1. معرفی
تکنیکهای یادگیری ماشین (ML) تاثیرات اجتماعی بزرگی در طیف گستردهای از برنامههای کاربردی مانند بینایی کامپیوتر، پردازش سخنرانی، درک زبان طبیعی، علوم اعصاب، بهداشت و اینترنت اشیا داشته است. ظهور عصر داده ای بزرگ موجب توجه به ML گردید. الگوریتم ML هرگز بهترین نتایج را به همراه نداشت و توسط دادههای بزرگ برای به دست آوردن بینش جدیدی در برنامههای کاربردی مختلف کسب و کار و رفتار انسان به چالش کشیده شد. از یک طرف، دادههای بزرگ اطلاعات بیسابقهای غنی برای الگوریتم ML برای استخراج الگوهای اساسی و ساخت مدلهای پیشبینی فراهم میکند. از سوی دیگر، الگوریتمهای سنتی ML با چالشهای مهمی مانند مقیاسپذیری مقادیر واقعی و پنهان داده های بزرگ رو به رو هستند. با گسترش وسیع دادههای بزرگ، ML در جهت تبدیل دادههای بزرگ به هوش عملی رشد و پیشرفت کرد.
ML به این پرسش که چگونه یک سیستم کامپیوتری بسازیم که به طور خودکار از طریق تجربه بهبود یابد پاسخ میدهد[1]. مشکل ML بهعنوان مشکل یادگیری از تجربه با توجه به برخی از وظایف و اندازهگیری عملکرد اشاره دارد. تکنیکهای ML کاربران را قادر به کشف ساختار زیرین و پیشبینی از مجموعه دادههای بزرگ میکند. ML در تکنیکهای یادگیری کارآمد (الگوریتم)، دادههای بزرگ غنی و محیطهای محاسبات قدرتمند بسیار کارآمد است. بنابراین، ML پتانسیل زیادی دارد تا بخش مهمی از تجزیه و تحلیل دادههای بزرگ [2] گردد.
این مقاله در نشریه الزویر منتشر شده و ترجمه آن با عنوان داده های بزرگ در سایت ای ترجمه به صورت رایگان قابل دانلود می باشد. جهت دانلود رایگان مقاله فارسی و انگلیسی روی عنوان فارسی (آبی رنگ) کلیک نمایید.
منبع: