数据集

SST (Stanford Sentiment Treebank)

斯坦福情感库是一个带有完全标记的解析树的语料库，可以全面分析情感在语言中的构成影响。该语料库基于 Pang 和 Lee (2005) 引入的数据集，由从电影评论中提取的 11,855 个单句组成。它使用斯坦福解析器进行解析，包括来自这些解析树的总共 215,154 个独特的短语，每个短语由 3 名人类评委注释。每个短语被标记为负面、有点负面、中性、有点正面或正面。所有 5 个语料库标签被称为 SST-5 或 SST 细粒度。完整句子的二元分类实验（否定或有些否定与有些肯定或肯定，丢弃中性句子）将数据集称为 SST-2 或 SST 二进制。

数据与资源

stanfordSentimentTreebank.zipapplication/zip
6.08 MiB

下载
stanfordSentimentTreebankRaw.zipapplication/zip
4.55 MiB

下载
trainDevTestTrees_PTB.zipapplication/zip
0.75 MiB

下载

附加信息

字段	值
数据集大小	11.38 MiB
最后更新	2024年11月10日
创建于	2024年11月10日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

SST (Stanford Sentiment Treebank)

数据与资源

附加信息

注册成功！