عنوان مقاله:
درک پاسخ COVID-19 توسط کاربران توییتر: رویکرد تجزیه و تحلیل متن
Understanding COVID-19 response by twitter users: A text analysis approach
سال انتشار: 2022
رشته: مهندسی فناوری اطلاعات - پزشکی
گرایش: اینترنت و شبکه های گسترده - بهداشت عمومی
دانلود رایگان این مقاله:
دانلود مقاله درک پاسخ COVID-19
مشاهده سایر مقالات جدید:
مقالات ISI مهندسی فناوری اطلاعات
5. Sentiment tag for each tweets
Once the final dataset was ready in the CSV format; the next step was to tag the sentiment score and magnitude. Google Cloud Natural language was used for this purpose along with Python code. The algorithm iterated over each tweet in the 100K final dataset where it called the Google NLP sentiment tagging API to get the sentiment score and sentiment magnitude. The score defined the polarity of the sentiment (−1 being most negative to +1 being most positive) whereas magnitude (0 to infinity) defined the strength of the emotion.
Post tagging the sentiment score and magnitude on each tweet, threshold for tagging each sentiment was selected. Per Google NLP API documentation this is subjective to the context of analysis being done using Python code. So, the following was used to tag each tweet into one of the four sentiments – positive, negative, mixed and neutral as per Table 1 given below:
‘The score, magnitude and sentiment tag were added as a new column in the dataset which was exported to CSV format to be used as a compatible file for insight generation and analysis via Python, Excel and Tableau. This file was called ‘the tagged dataset’.
(دقت کنید که این بخش از متن، با استفاده از گوگل ترنسلیت ترجمه شده و توسط مترجمین سایت ای ترجمه، ترجمه نشده است و صرفا جهت آشنایی شما با متن میباشد.)
5. برچسب احساسات برای هر توییت
هنگامی که مجموعه داده نهایی در قالب CSV آماده شد. مرحله بعدی علامت گذاری امتیاز و میزان احساسات بود. برای این منظور از زبان طبیعی Google Cloud در کنار کد پایتون استفاده شده است. الگوریتم روی هر توییت در مجموعه داده نهایی 100 هزار تکرار میشود، جایی که API برچسبگذاری احساسات NLP Google را برای دریافت امتیاز احساسات و اندازه احساسات نامیده میشود. این امتیاز قطبیت احساسات را تعریف می کند (-1 منفی ترین و +1 مثبت ترین) در حالی که قدر (0 تا بی نهایت) قدرت احساسات را مشخص می کند.
پست برچسبگذاری امتیاز و میزان احساسات در هر توییت، آستانه برچسبگذاری هر احساس انتخاب شد. بر اساس اسناد Google NLP API، این موضوع منوط به زمینه تحلیلی است که با استفاده از کد پایتون انجام می شود. بنابراین، از موارد زیر برای برچسب گذاری هر توییت به یکی از چهار احساس - مثبت، منفی، مختلط و خنثی مطابق جدول 1 در زیر استفاده شد: