数据集

情感与文本数据集

标题：情感与文本数据集

数据内容：该数据集包含多个与情感分析、文本内容以及社交媒体相关的字段。主要数据元素包括： - 用户标识符（id） - 用户名（author） - 社区标识符（subreddit） - 链接标识符（link_id） - 父评论标识符（parent_id） - 时间戳（created_utc） - 评分者标识符（rater_id） - 文本内容（text） - 情感类别（emotion, anger, joy, love, etc.） - 文本内容的清晰度（example_very_unclear） - 情感强度相关的概率（odds） - 频率信息（freq）

数据来源：互联网公开数据

数据用途：该数据集可用于多个行业的分析和研究，包括但不限于： - 科技行业：自然语言处理、情感分析、社交媒体监控 - 医疗行业：心理健康监测、情绪分析 - 媒体行业：内容推荐、用户行为分析 - 市场营销：消费者情绪分析、品牌影响力评估

标签：情感分析, 文本数据, 社交媒体, 情绪分类, 自然语言处理, 用户行为, 数据科学, 情感强度, 情感概率, 社区分析，

行业分类： - 科技（人工智能、大数据分析） - 医疗（心理健康、情绪监测） - 媒体（内容推荐、用户分析） - 市场营销（消费者洞察、品牌分析）

统计分析： - 数据集包含43884条记录，每条记录包含多个字段。 - 情感类字段（如anger, joy, love等）共有30种不同值，每种情感类别仅有2种可能值。 - 文本字段（text）具有43701种不同值，说明文本内容具有高度多样性。 - 用户标识符（id）和作者（author）字段分别有43884种和38184种不同值，表明数据集覆盖了大量不同的用户。 - 社区标识符（subreddit）字段有483种不同值，说明数据集涉及多个不同的社交媒体社区。

数据与资源

ekman_labels.csvCSV
0.00 MiB

下载
emotion_words.csvCSV
0.03 MiB

下载
goemotions_1.csvCSV
13.52 MiB

下载
goemotions_2.csvCSV
13.52 MiB

下载
goemotions_3.csvCSV
13.73 MiB

下载

附加信息

字段	值
版本	1
数据集大小	40.79 MiB
最后更新	2025年4月23日
创建于	2025年4月23日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

情感与文本数据集

数据与资源

附加信息

注册成功！