چکیده
یادگیری ماشین (ML) بهطور مداوم قدرت خود را در طیف گستردهای از برنامههای کاربردی نشان میدهد. این مسئله در سال های اخیر تا حدودی با توجه به ظهور دادههای بزرگ بیشتر مورد توجه قرار گرفته است. الگوریتم ML هرگز بهترین عملکرد خود را نداشت تا اینکه توسط دادههای بزرگ به چالش کشیده شد. دادههای بزرگ، الگوریتم ML را قادر به کشف الگوهای دقیقتر و پیشبینی به موقع تر و دقیق تر از قبل کردند. از سوی دیگر، چالشهای بزرگی در ML مانند مقیاسپذیری مدل و محاسبات توزیع شده مطرح کرد. در این مقاله، یک چارچوب از ML در دادههای بزرگ (MLBiD) برای هدایت بحث به فرصتها و چالشهای آن معرفی خواهد شد. چارچوب ML محور، شامل مراحل پیش پردازش، یادگیری و ارزشیابی است. علاوه براین، چارچوب شامل چهار جزء دیگر، مانند دادههای بزرگ، کاربران، دامنه و سیستم است. مراحل ML و اجزای MLBiD برای شناسایی فرصتهای مرتبط و چالشها و روشن کردن مسیر کاری آینده در بسیاری از موارد ناشناخته و یا در پژوهش حاضر ارائه شده است.