印度尼西亚推特抑郁与焦虑情绪分析数据集2023

印度尼西亚推特抑郁与焦虑情绪分析数据集2023

数据来源:互联网公开数据

标签:抑郁,焦虑,社交媒体分析,情绪识别,推特数据,双向LSTM,情感计算

数据概述: 本数据集作为“Bangkit”毕业设计项目的一部分创建并发布,基于David Owen、Jose Camacho Collados和Luis Espinosa-Anke的研究论文。数据集包含三个文件:datd_train.csv、datd_test.csv和datd_rand.csv。其中,datd_train.csv和datd_test.csv用于模型训练,datd_rand.csv用于模型评估。datd_rand.csv包含datd_test.csv中的部分正面条目,以及不包含“depres”、“cemas”或“gelisah”关键词的随机推特。这些随机推特被标记为负面。

数据用途概述: 该数据集适用于抑郁和焦虑情绪识别的研究、社交情绪分析、推特情绪趋势分析等多种场景。研究人员可以利用模型对推特数据进行情感分类,评估不同情绪状态在社交媒体上的表现;心理健康服务提供者可以借助数据识别潜在的心理健康问题;政策制定者可以基于数据制定更有针对性的社会心理支持政策。此外,数据集也适合用于教育培训,帮助学习者理解情绪分析的基本原理和应用方法。

举例: 本数据集通过使用双向LSTM模型,实现了95%的准确率、75%的精确度和79%的召回率(F1分数为0.766),展示了其在情绪识别任务中的良好性能。例如,模型能够有效区分推特中表达抑郁和焦虑情绪的正面条目与不包含相关关键词的负面随机推特。

数据与资源

附加信息

字段
版本 1.0
最后更新 四月 14, 2025, 18:22 (UTC)
创建于 四月 14, 2025, 18:22 (UTC)