数据集

新冠疫情社交媒体文本情感分析数据集COVID-19SocialMediaTextSentimentAnalysisDataset-riddhidhawan01

数据来源：互联网公开数据

标签：新冠疫情, 社交媒体, 情感分析, 文本挖掘, 机器学习, Twitter, 情感分类, 数据标注

数据概述：该数据集包含来自Twitter平台上的公开文本数据，记录了与新冠疫情相关的推文内容及其对应的情感分析结果。主要特征如下：时间跨度：数据记录的时间范围主要集中在2020年12月。地理范围：数据来源于全球范围内的Twitter用户，涵盖了不同国家和地区。数据维度：数据集包括多个维度，如推文ID、用户名、用户位置、用户描述、用户创建时间、关注者数量、好友数量、收藏数量、是否认证、推文发布日期、推文文本、话题标签、发布来源、转发数、喜欢数、是否为转发、情感分析结果（包括积极、中性、消极情感得分和复合情感得分）、推文单词数量、平均词长、NLTK情感分析结果以及情感类别标签（0代表负面，1代表正面，2代表中性）。数据格式：CSV格式，文件名为database_Label.csv，方便进行数据分析和处理。数据来源：数据来源于Twitter公开API，经过清洗和情感分析处理。该数据集适合用于新冠疫情相关的情感分析研究，以及文本挖掘和机器学习模型的构建。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于公共卫生、社会科学等领域的研究，例如分析公众对疫情的态度、情绪变化，以及不同疫苗品牌相关的讨论。行业应用：可以为市场调研、舆情监测等行业提供数据支持，尤其是在分析消费者对疫苗的态度、疫情期间的品牌声誉等方面。决策支持：支持政府、医疗机构和企业等相关机构进行疫情相关的决策制定，例如调整公共卫生宣传策略、优化疫苗推广方案等。教育和培训：作为数据科学、自然语言处理等课程的辅助材料，帮助学生和研究人员深入理解情感分析、文本挖掘等技术在实际问题中的应用。此数据集特别适合用于探索社交媒体文本中的情感表达规律，分析疫情期间不同群体的情绪变化，并为相关决策提供数据支持。

数据与资源

versions_20250413061630.zipZIP
26.94 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	26.94 MiB
最后更新	2025年5月7日
创建于	2025年5月7日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

新冠疫情社交媒体文本情感分析数据集COVID-19SocialMediaTextSentimentAnalysisDataset-riddhidhawan01

数据与资源

附加信息

注册成功！