推特情感分析数据集-2009年-prox37

推特情感分析数据集-2009年-prox37 数据来源:互联网公开数据 标签:情感分析,推特,社交媒体,文本分析,情感标注,数据集,2009年

数据概述: 本数据集包含2009年推特上的部分推文,经过处理后去除了表情符号。数据集以CSV格式存储,每条记录包含六个字段:

0 - 推文的情感极性(0表示负面,2表示中性,4表示正面) 1 - 推文的唯一标识符(如2087) 2 - 推文的发布日期(如Sat May 16 23:58:44 UTC 2009) 3 - 查询关键词(如lyx)。如果没有查询,则该字段为NO_QUERY 4 - 发布推文的用户(如robotickilldozr) 5 - 推文的具体内容(如Lyx is cool)

数据集中的情感标注是根据推文内容由人工标注的,适用于情感分析和文本挖掘等应用场景。

数据用途概述: 该数据集适用于情感分析研究、社交媒体数据分析、自然语言处理教学和研究、市场情绪监测等多种场景。研究人员可以利用此数据集进行情感分类模型的训练和验证;企业可以利用数据了解市场情绪和用户反馈;教育机构可以用作自然语言处理课程的教学资源。该数据集为相关领域的研究提供了宝贵的数据支持。

数据与资源

附加信息

字段
版本 1.0
最后更新 五月 31, 2025, 10:37 (UTC)
创建于 五月 31, 2025, 10:37 (UTC)