عنوان فارسی مقاله: |
پردازش پایگاه داده ها و مقایسه بین روش های داده کاوی |
عنوان انگلیسی مقاله: |
Database Preprocessing and Comparison between Data Mining Methods |
چکیده
پردازش پایگاه داده ها در بهره برداری از مصرف حافظه بسیار حایز اهمیت می باشد ، متراکم سازی یکی از ابزار پیش پردازش ضروری برای کاستن از حافظه مورد نیاز برای ذخیره کردن و بارگذاری داده ها به منظور پردازش می باشد ، روش متراکم سازی ارایه شده در این مقاله از طریق بکارگیری مثال های پیشنهاد شده مورد تست قرار گرفت تا تاثیر تکرار در پایگاه داده ها و همچنین اندازه پایگاه داده ها را نشان بدهد و نتایج مشخص نمودند که هر وقت تکرار افزایش یافته است ، نسیت متراکم سازی افزایش خواهد یافت . متراکم سازی یکی از فعالیت های مهم برای پیش پردازش داده ها قبل از اجرای داده کاوی می باشد . روش های داده کاوی نظیر Na¨ıve Bayes ، , Nearest neighbor و درختان تصمیم گیری مورد تست قرار می گیرند . اجرای سه روش نشان داد که روش Naïve Bayes به طور موثری درزمانی استفاده می شود که نشانه های داده ها دسته بندی می شوند و ان روش را می توان به طور موفقیت آمیزی در یادگیری ماشینی استفاده نمود . روش Nearest neighbor در زمانی بسیار مناسب می باشد که نشانه های داده ها دایمی هستند یا دسته بندی می شوند . درختان تصمیم گیری سومین روشی می باشد که مورد تست قرار گرفت و این روش یک روش پیشگویانه ساده می باشد که از طریق بکارگیری روش های ساده قاعده در دسته بندی داده ها اجراء گردید . موفقیت اجرای داده کاوی به کامل بودن پایگاه داده ها بستگی دارد که از طریق مخزن های داده ها نشان داده شدند که بایستی از طریق بکارگیری مشخصه های مهم مخزن داده ها سازماندهی گردند .