عنوان مقاله:

داده کاوی آموزشی برای حمایت از یادگیری برنامه نویسی با استفاده از داده های حل مسئله

Educational Data Mining to Support Programming Learning Using Problem-Solving Data

سال انتشار: 2022

رشته: مهندسی صنایع - مهندسی کامپیوتر

گرایش: داده کاوی - بهینه سازی سیستم ها

دانلود رایگان این مقاله:

دانلود مقاله یادگیری برنامه نویسی

مشاهده سایر مقالات جدید:

 

مقالات ISI مهندسی صنایع

 

مقالات ISI مهندسی کامپیوتر

Experimental Results
In this section, we present the various experimental results. First, we visualize the data in clusters and extract the basic statistical features from each cluster. Next, we present data patterns (e.g., frequencies, ranking, number of rules, etc.) from each cluster, and finally, we show the relevant association rules extracted from each cluster.

A. Determining the Value of K and Data Clustering
To determine the suitable number (k ) of clusters, we applied the Elbow method to the dataset. First, we select a random number of clusters and compute the SSE value in each cluster. In Figure 3, we can see that the SSE value is stable after the number of clusters k=4 . According to the results of the Elbow method shown in Figure 3, we obtained the appropriate number (k=4 ) of clusters to perform the main clustering operation using the MK-means algorithm on the dataset (Table 2).
Next, we applied the MK-means and other random initial center selection (RCS) with K-means clustering algorithms to the dataset. The cluster data visualization by the RCS with K-means is shown in Figure 4a and the MK-means clustering algorithm is shown in Figure 4b. The results show that the MK-means clustering algorithm requires 17.33% less number of iterations to build clusters than the RCS with K-means clustering algorithm using our dataset. Furthermore, when we tested the MK-means clustering algorithm on approximately 110,000 synthetic data points, the algorithm performed better in terms of the number of iterations and SSE . Figure 4 shows that the data overlaps occurred during clustering when the K-means algorithm with RCS, while the MK-means algorithm clustered the data in a clean manner.

(دقت کنید که این بخش از متن، با استفاده از گوگل ترنسلیت ترجمه شده و توسط مترجمین سایت ای ترجمه، ترجمه نشده است و صرفا جهت آشنایی شما با متن میباشد.)

نتایج تجربی
در این بخش، نتایج تجربی مختلف را ارائه می کنیم. ابتدا داده ها را در خوشه ها تجسم می کنیم و ویژگی های آماری اولیه را از هر خوشه استخراج می کنیم. در مرحله بعد، الگوهای داده ای (به عنوان مثال، فرکانس ها، رتبه بندی، تعداد قوانین و غیره) را از هر خوشه ارائه می کنیم، و در نهایت، قوانین ارتباط مربوطه را که از هر خوشه استخراج شده است نشان می دهیم.

الف. تعیین مقدار K و خوشه بندی داده ها
برای تعیین تعداد مناسب (k ) خوشه ها، روش Elbow را روی مجموعه داده اعمال کردیم. ابتدا تعداد تصادفی از خوشه ها را انتخاب می کنیم و مقدار SSE را در هر خوشه محاسبه می کنیم. در شکل 3 می بینیم که مقدار SSE بعد از تعداد خوشه ها k=4 پایدار است. با توجه به نتایج روش Elbow که در شکل 3 نشان داده شده است، تعداد مناسب (k=4) خوشه را برای انجام عملیات خوشه بندی اصلی با استفاده از الگوریتم MK-means بر روی مجموعه داده به دست آوردیم (جدول 2).