亚马逊商品评论情感细粒度分析数据集-训练与测试集

亚马逊商品评论情感细粒度分析数据集-训练与测试集 数据来源:互联网公开数据 标签:亚马逊,商品评论,情感分析,文本数据,机器学习,自然语言处理,训练集,测试集 数据概述: 本数据集包含来自亚马逊的商品评论,用于情感细粒度分析。数据集构建方式为,从1到5分的每个评分等级中随机抽取60万条训练样本和13万条测试样本。因此,训练集中共有300万条样本,测试集中共有65万条样本。

数据集文件train.csv和test.csv包含了所有训练样本,采用逗号分隔值(CSV)格式。每个文件中包含3列:评分等级(1到5)、评论标题和评论正文。评论标题和正文使用双引号(")进行转义,内部的双引号使用两个双引号("")表示。换行符使用反斜杠后跟一个“n”字符(即“\n”)进行转义。

数据用途概述: 该数据集适用于情感分析模型的训练和评估。研究人员可以利用此数据开发和测试各种情感分析算法,例如,基于机器学习或深度学习的模型。数据集也可用于探索不同评分等级下评论文本的特征,或进行情感分类任务。此外,该数据集也适合作为教学资源,帮助学生理解情感分析的基本原理和应用。

数据与资源

附加信息

字段
版本 1.0
最后更新 五月 31, 2025, 14:29 (UTC)
创建于 五月 31, 2025, 14:28 (UTC)