疫苗接种评论情感分析数据集VaccinationCommentsSentimentAnalysisDataset-dimasananda

疫苗接种评论情感分析数据集VaccinationCommentsSentimentAnalysisDataset-dimasananda

数据来源:互联网公开数据

标签:情感分析, 疫苗接种, 文本挖掘, 社交媒体, 自然语言处理, 情感分类, 印度尼西亚, 疫情

数据概述: 该数据集包含来自社交媒体平台的关于疫苗接种的评论数据,旨在用于情感分析任务。主要特征如下: 时间跨度:数据集未明确标注时间范围,推测为疫情期间的评论数据集合。 地理范围:数据主要来源于印度尼西亚社交媒体平台。 数据维度:数据集包括评论的ID、评论文本(komentar)、情感标签(label)、情感类型(tipe_sentimen)、来源平台(sumber)以及文本处理后的多个阶段结果,包括大小写转换(case_folding)、分词(tokenizing)、停用词过滤(filtering)、拼写检查(spell_checker)和词干提取(stemming)。 数据格式:数据集以CSV格式提供,文件名为Dataset_Vaksinasi_Skripsi.csv,同时包含用于训练、测试的.npy文件以及预训练的词向量模型(.w2v)和模型文件(.model)。 来源信息:数据来源于社交媒体平台,经过了数据清洗和预处理,包括文本标准化、分词、过滤、拼写纠正和词干提取等步骤。 该数据集适合用于情感分析、文本分类、自然语言处理等相关领域的研究与应用。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于情感分析、文本挖掘、自然语言处理领域的学术研究,例如针对疫苗接种相关舆情的分析、情感极性识别、关键词提取等。 行业应用:为政府部门、医疗机构和社交媒体平台提供数据支持,用于监测公众对疫苗接种的态度、评估宣传效果、辅助决策制定。 决策支持:支持相关机构在疫情期间的舆情监测与分析,辅助制定疫苗接种相关的公共卫生策略。 教育和培训:作为自然语言处理、机器学习和情感分析课程的实训数据,帮助学生和研究人员理解和应用相关技术。 此数据集特别适合用于研究疫苗接种相关的公众情绪,探索影响公众态度的因素,并为改善疫苗接种宣传策略提供数据支持。

数据与资源

附加信息

字段
版本 1.0
最后更新 五月 29, 2025, 15:20 (UTC)
创建于 五月 29, 2025, 15:19 (UTC)