Webis_Tripad_Source_酒店评论情感流分析语料数据_2013

数据集概述

本数据集为Webis Tripad 2013情感语料库,包含2100条英文酒店评论,用于情感流分析方法的开发与评估。每条评论含总体评分、元数据及两类标注:亚马逊众包工人标注的语句情感极性(正、负、客观),以及领域专家标注的酒店相关方面信息。

文件详解

  • 文件名称:corpus-webis-tripad-13-sentiment.zip
  • 文件格式:ZIP(压缩包)
  • 字段映射介绍:压缩包内包含2100条酒店评论数据,每条评论的核心字段包括:总体评分、元数据、语句级情感极性标注(正/负/客观)、酒店方面标注(如服务、房间等)

数据来源

Webis Tripad Sentiment Corpus 2013(Webis-Tripad-13-Sentiment)

适用场景

  • 情感流分析模型开发: 用于训练和测试酒店评论中语句级情感极性的识别与情感变化趋势分析模型。
  • 情感标注方法评估: 对比众包标注与专家标注的差异,优化情感标注流程。
  • 酒店领域情感词典构建: 基于标注的酒店方面信息,构建领域专用情感词典。
  • 自然语言处理算法验证: 作为基准数据集,验证情感分析、方面提取等NLP算法的性能。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 2.78 MiB
最后更新 2026年1月20日
创建于 2026年1月20日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。