عنوان مقاله:

یادگیری عمیق برای تشخیص اخبار جعلی در توییتر در رابطه با اعتراضات هنگ کنگ 2019

Deep learning for fake news detection on Twitter regarding the 2019 Hong Kong protests

سال انتشار: 2022

رشته: مهندسی فناوری اطلاعات - مهندسی کامپیوتر

گرایش: اینترنت و شبکه های گسترده - هوش مصنوعی

دانلود رایگان این مقاله:

دانلود مقاله تشخیص اخبار جعلی

مشاهده سایر مقالات جدید:

 

مقالات ISI مهندسی فناوری اطلاعات

 

مقالات ISI مهندسی کامپیوتر

4 Results

In this section, the predictive performance of the ML algorithms is evaluated, detailing the hyperparameter selection process to avoid overfitting and evaluating the results acquired for the various feature-sets, while comparing them with results found in related work.

4.1 Algorithm evaluation

The ML algorithms utilized for the classification of tweets spreading fake and real news are trained using the extracted feature-sets of the collected datasets, and the corresponding evaluation results are presented. The dataset consists of 3,910 and 5388 tweets spreading fake and real news, respectively, with the majority class baseline being 57.9%. The evaluation metrics presented include macro-average and per-class precision, recall and F1 Score. For all ML algorithms, fivefold cross-validation is used to increase reliability of results. The evaluation results are summarized in Table 4, with the highest performing algorithm per feature-set listed in bold.

For Feature-set 1, the highest performing algorithm is random forest, achieving an average F1 Score of 92.1%. The rest of the traditional ML algorithms perform similarly, with the lowest F1 score being 89.4% achieved by Naive Bayes. These algorithms are the least computationally intensive, while also processing the simplest of the three feature-sets, yet they achieve adequate performance. They also have the benefit of providing interpreting results, which are further analyzed in a later subsection.

(دقت کنید که این بخش از متن، با استفاده از گوگل ترنسلیت ترجمه شده و توسط مترجمین سایت ای ترجمه، ترجمه نشده است و صرفا جهت آشنایی شما با متن میباشد.)

4 نتیجه

در این بخش، عملکرد پیش‌بینی الگوریتم‌های ML ارزیابی می‌شود و فرآیند انتخاب فراپارامتر را برای جلوگیری از برازش بیش از حد و ارزیابی نتایج به‌دست‌آمده برای مجموعه‌های ویژگی‌های مختلف، در حالی که آنها را با نتایج یافت شده در کار مرتبط مقایسه می‌کند، شرح می‌دهد.

4.1 ارزیابی الگوریتم

الگوریتم‌های ML مورد استفاده برای طبقه‌بندی توییت‌هایی که اخبار جعلی و واقعی را منتشر می‌کنند با استفاده از مجموعه ویژگی‌های استخراج‌شده از مجموعه داده‌های جمع‌آوری‌شده آموزش داده می‌شوند و نتایج ارزیابی مربوطه ارائه می‌شوند. مجموعه داده شامل 3910 و 5388 توییت است که به ترتیب اخبار جعلی و واقعی را منتشر می کنند، که اکثریت پایه کلاس 57.9٪ است. معیارهای ارزیابی ارائه شده شامل میانگین کلان و دقت هر کلاس، یادآوری و امتیاز F1 است. برای همه الگوریتم‌های ML، اعتبارسنجی متقابل پنج‌گانه برای افزایش قابلیت اطمینان نتایج استفاده می‌شود. نتایج ارزیابی در جدول 4 خلاصه شده است، با بالاترین عملکرد الگوریتم در هر مجموعه ویژگی به صورت پررنگ فهرست شده است.