-
ACL_cite_Based_学术句子引用价值预测标注数据集
2026年1月29日 30 89 28
数据集概述 本数据集为NAACL 2021论文配套的ACL-cite数据集,包含从ACL Anthology学术文献中提取的270余万句学术文本,及对应句子是否需要引用的标注标签,用于研究上下文对句子引用价值预测的作用。数据集含三个CSV文件,按文档ID划分训练、验证和测试集。 文件详解 压缩包文件 文件名称:ACL-cite.zip 文件格式:ZIP...
-
LAMBADA单词预测数据集
2025年5月31日 30 102 7
LAMBADA单词预测数据集 数据来源:互联网公开数据 标签:单词预测,自然语言处理,文本理解,上下文建模,机器学习,模型评估,文本生成 数据概述:...



