数据集概述
本数据集包含2022年7月23日至2024年9月5日期间的60,127条Instagram猴痘相关帖子,覆盖52种语言。每条帖子标注了Post ID、原始描述、发布日期、语言、英文翻译版,以及情感(细粒度7类)、仇恨言论、焦虑/压力检测结果,可用于社交媒体文本分析与公共卫生研究。
文件详解
- 文件名称:Dataset.xlsx
- 文件格式:XLSX
- 字段映射介绍:
- Post ID:Instagram帖子唯一标识
- Post Description:帖子原始语言完整描述
- Date:发布日期(MM/DD/YYYY格式)
- Language:Google Translate API检测的帖子语言
- Translated Post Description:非英文帖子的英文翻译版
- Sentiment:情感分类结果(fear/surprise/joy/sadness/anger/disgust/neutral)
- Hate:仇恨言论检测结果(hate/not hate)
- Anxiety or Stress:焦虑/压力检测结果(stress/anxiety detected/no stress/anxiety detected)
数据来源
论文“Mpox narrative on Instagram: A labeled multilingual dataset of Instagram posts on mpox for sentiment, hate speech, and anxiety analysis”
适用场景
- 公共卫生舆情监测:分析猴痘疫情期间社交媒体用户的情感倾向、焦虑程度及仇恨言论分布
- 多语言文本分类研究:用于训练和测试多语言情感、仇恨言论、焦虑检测的机器学习模型
- 跨文化传播分析:对比不同语言地区用户对猴痘话题的态度差异
- 社交媒体健康传播效果评估:探究Instagram平台上猴痘相关信息的传播特征与用户反应
- 公共卫生干预策略制定:基于用户情感和焦虑数据优化猴痘防控的信息发布与心理疏导措施