عنوان مقاله:
اصول طراحی برای تجزیه و تحلیل داده ها
Design Principles for Data Analysis
سال انتشار: 2022
رشته: مهندسی کامپیوتر - آمار
گرایش: هوش مصنوعی - مهندسی الگوریتم و محاسبات - آمار ریاضی
دانلود رایگان این مقاله:
دانلود مقاله تجزیه و تحلیل داده ها
مشاهده سایر مقالات جدید:
4 Discussion
In this paper, we introduce a set of data analytic design principles with the goal of describing variation between data analyses. These principles are characteristics of the data analysis made by the producer considering the needs of the consumer used in the application of design thinking (and complementary to statistical thinking) in the practice of data analysis. We also illustrated the use of these data analytic principles in two classroom settings aimed at teaching data analysis. In our analysis of the classroom data, we found that the principles defined here appear to measure underlying quantities that are reasonably uncorrelated with each other (Figures 3- S8).
The data from the Wake Forest and Johns Hopkins studies presented in Section 3 suggest that there is variation in principle scores across individuals working on the same data analysis task. While we would hypothesize that this variation in scores is attributable to the choices made by the individual analysts, the data suggest that an interesting avenue for future work would be to design studies to identify specific characteristics or qualities on the individuals that explain the variation in scores. The data on student majors in Figure 2 only hints at such an explanation.
One significant consequence of using design thinking concepts in data analysis is that it allows for the explicit separation of producers and consumers of a data analysis. The benefit of conceptually separating producers from consumers is that such a separation serves to demonstrate potential differences in priorities between the two groups. Traditional descriptions of statistical thinking generally conceive of a single analyst building data analyses and obtaining feedback on their approach from the data. There is frequently an iterative process, by which the data available informs the question able to be answered. While the notion of a consumer for that analysis may be embedded in the idea of statistical thinking, it is often not well-specified.
(دقت کنید که این بخش از متن، با استفاده از گوگل ترنسلیت ترجمه شده و توسط مترجمین سایت ای ترجمه، ترجمه نشده است و صرفا جهت آشنایی شما با متن میباشد.)
4. بحث
در این مقاله، مجموعهای از اصول طراحی تحلیلی دادهها را با هدف توصیف تنوع بین تجزیه و تحلیل دادهها معرفی میکنیم. این اصول ویژگی های تجزیه و تحلیل داده های ساخته شده توسط تولید کننده با توجه به نیازهای مصرف کننده است که در کاربرد تفکر طراحی (و مکمل تفکر آماری) در عمل تجزیه و تحلیل داده ها استفاده می شود. ما همچنین استفاده از این اصول تحلیل داده ها را در دو محیط کلاس درس با هدف آموزش تجزیه و تحلیل داده ها نشان دادیم. در تجزیه و تحلیل ما از دادههای کلاس درس، متوجه شدیم که اصول تعریفشده در اینجا به نظر میرسد مقادیر زیربنایی را اندازهگیری میکنند که به طور منطقی با یکدیگر همبستگی ندارند (شکلهای 3-S8).
دادههای حاصل از مطالعات Wake Forest و Johns Hopkins ارائهشده در بخش 3 نشان میدهد که در نمرات اصلی بین افرادی که روی یک کار تجزیه و تحلیل داده کار میکنند، تفاوت وجود دارد. در حالی که ما فرض می کنیم که این تنوع در امتیازات به انتخاب های انجام شده توسط تحلیلگران منتسب است، داده ها نشان می دهد که یک راه جالب برای کار آینده طراحی مطالعاتی برای شناسایی ویژگی ها یا کیفیت های خاص بر روی افراد است که تغییرات در امتیازات را توضیح می دهد. . داده های مربوط به رشته های دانشجویی در شکل 2 تنها به چنین توضیحی اشاره دارد.