情感与文本数据集

标题:情感与文本数据集

数据内容: 该数据集包含多个与情感分析、文本内容以及社交媒体相关的字段。主要数据元素包括: - 用户标识符(id) - 用户名(author) - 社区标识符(subreddit) - 链接标识符(link_id) - 父评论标识符(parent_id) - 时间戳(created_utc) - 评分者标识符(rater_id) - 文本内容(text) - 情感类别(emotion, anger, joy, love, etc.) - 文本内容的清晰度(example_very_unclear) - 情感强度相关的概率(odds) - 频率信息(freq)

数据来源: 互联网公开数据

数据用途: 该数据集可用于多个行业的分析和研究,包括但不限于: - 科技行业:自然语言处理、情感分析、社交媒体监控 - 医疗行业:心理健康监测、情绪分析 - 媒体行业:内容推荐、用户行为分析 - 市场营销:消费者情绪分析、品牌影响力评估

标签:情感分析, 文本数据, 社交媒体, 情绪分类, 自然语言处理, 用户行为, 数据科学, 情感强度, 情感概率, 社区分析,

行业分类: - 科技(人工智能、大数据分析) - 医疗(心理健康、情绪监测) - 媒体(内容推荐、用户分析) - 市场营销(消费者洞察、品牌分析)

统计分析: - 数据集包含43884条记录,每条记录包含多个字段。 - 情感类字段(如anger, joy, love等)共有30种不同值,每种情感类别仅有2种可能值。 - 文本字段(text)具有43701种不同值,说明文本内容具有高度多样性。 - 用户标识符(id)和作者(author)字段分别有43884种和38184种不同值,表明数据集覆盖了大量不同的用户。 - 社区标识符(subreddit)字段有483种不同值,说明数据集涉及多个不同的社交媒体社区。

数据与资源

附加信息

字段
版本 1
最后更新 四月 23, 2025, 02:11 (UTC)
创建于 四月 23, 2025, 02:06 (UTC)