SST (Stanford Sentiment Treebank)

斯坦福情感库是一个带有完全标记的解析树的语料库,可以全面分析情感在语言中的构成影响。该语料库基于 Pang 和 Lee (2005) 引入的数据集,由从电影评论中提取的 11,855 个单句组成。它使用斯坦福解析器进行解析,包括来自这些解析树的总共 215,154 个独特的短语,每个短语由 3 名人类评委注释。每个短语被标记为负面、有点负面、中性、有点正面或正面。所有 5 个语料库标签被称为 SST-5 或 SST 细粒度。完整句子的二元分类实验(否定或有些否定与有些肯定或肯定,丢弃中性句子)将数据集称为 SST-2 或 SST 二进制。

packageimg

数据与资源

附加信息

字段
数据集大小 11.38 MiB
最后更新 2024年11月10日
创建于 2024年11月10日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。