عنوان مقاله:
یادگیری عمیق برای تشخیص اخبار جعلی در توییتر در رابطه با اعتراضات هنگ کنگ 2019
Deep learning for fake news detection on Twitter regarding the 2019 Hong Kong protests
سال انتشار: 2022
رشته: مهندسی فناوری اطلاعات - مهندسی کامپیوتر
گرایش: اینترنت و شبکه های گسترده - هوش مصنوعی
دانلود رایگان این مقاله:
مشاهده سایر مقالات جدید:
مقالات ISI مهندسی فناوری اطلاعات
4 Results
In this section, the predictive performance of the ML algorithms is evaluated, detailing the hyperparameter selection process to avoid overfitting and evaluating the results acquired for the various feature-sets, while comparing them with results found in related work.
4.1 Algorithm evaluation
The ML algorithms utilized for the classification of tweets spreading fake and real news are trained using the extracted feature-sets of the collected datasets, and the corresponding evaluation results are presented. The dataset consists of 3,910 and 5388 tweets spreading fake and real news, respectively, with the majority class baseline being 57.9%. The evaluation metrics presented include macro-average and per-class precision, recall and F1 Score. For all ML algorithms, fivefold cross-validation is used to increase reliability of results. The evaluation results are summarized in Table 4, with the highest performing algorithm per feature-set listed in bold.
For Feature-set 1, the highest performing algorithm is random forest, achieving an average F1 Score of 92.1%. The rest of the traditional ML algorithms perform similarly, with the lowest F1 score being 89.4% achieved by Naive Bayes. These algorithms are the least computationally intensive, while also processing the simplest of the three feature-sets, yet they achieve adequate performance. They also have the benefit of providing interpreting results, which are further analyzed in a later subsection.
(دقت کنید که این بخش از متن، با استفاده از گوگل ترنسلیت ترجمه شده و توسط مترجمین سایت ای ترجمه، ترجمه نشده است و صرفا جهت آشنایی شما با متن میباشد.)
4 نتیجه
در این بخش، عملکرد پیشبینی الگوریتمهای ML ارزیابی میشود و فرآیند انتخاب فراپارامتر را برای جلوگیری از برازش بیش از حد و ارزیابی نتایج بهدستآمده برای مجموعههای ویژگیهای مختلف، در حالی که آنها را با نتایج یافت شده در کار مرتبط مقایسه میکند، شرح میدهد.
4.1 ارزیابی الگوریتم
الگوریتمهای ML مورد استفاده برای طبقهبندی توییتهایی که اخبار جعلی و واقعی را منتشر میکنند با استفاده از مجموعه ویژگیهای استخراجشده از مجموعه دادههای جمعآوریشده آموزش داده میشوند و نتایج ارزیابی مربوطه ارائه میشوند. مجموعه داده شامل 3910 و 5388 توییت است که به ترتیب اخبار جعلی و واقعی را منتشر می کنند، که اکثریت پایه کلاس 57.9٪ است. معیارهای ارزیابی ارائه شده شامل میانگین کلان و دقت هر کلاس، یادآوری و امتیاز F1 است. برای همه الگوریتمهای ML، اعتبارسنجی متقابل پنجگانه برای افزایش قابلیت اطمینان نتایج استفاده میشود. نتایج ارزیابی در جدول 4 خلاصه شده است، با بالاترین عملکرد الگوریتم در هر مجموعه ویژگی به صورت پررنگ فهرست شده است.