-
PropBank数据库与SentenceBERT嵌入数据集
2025年12月22日 30 24 23
数据集概述 本数据集是包含SentenceBERT嵌入的PropBank数据库,用于论文“CALAMR: Component ALignment for Abstract Meaning Representation”。数据库涵盖角色、角色集等PropBank数据及示例、描述、函数等嵌入信息,支持独立使用或通过zensols.propbankdb...
-
实体消歧Agnus输入数据集
2025年12月20日 30 179 28
数据集概述 本数据集是用于实体消歧任务的输入数据集合,包含五个压缩文件,涵盖MSNBCt、AQUAINT、ACE2004t、KORE50、AIDA-Syn等不同来源或类型的实体消歧输入数据,为实体消歧算法的训练与测试提供基础数据支持。 文件详解 该数据集包含五个压缩文件,具体说明如下: - 文件名称及格式: -...
-
SemEval_2020_无监督词汇语义变化检测瑞典语测试数据集
2025年12月12日 30 179 44
数据集概述 本数据集为SemEval 2020任务1(无监督词汇语义变化检测)的瑞典语测试数据,包含两个不同时期的瑞典语文本语料库、31个目标词元及对应语义变化标注结果,用于评估词汇语义变化检测模型性能。 文件详解 该数据集包含一个ZIP格式压缩包,内部文件结构及内容如下: -...
-
数据2022年全国知识图谱与语义计算大会NLPCC2022多语言摘要生成数据集-basmarg
2025年5月18日 30 119 66
2022年全国知识图谱与语义计算大会NLPCC2022多语言摘要生成数据集-basmarg 数据来源:互联网公开数据 标签:自然语言处理,文本生成,多语言,学术论文,摘要生成,深度学习,机器翻译,语义计算 数据概述: 该数据集来源于2022年全国知识图谱与语义计算大会(NLPCC 2022),旨在促进多语言摘要生成的研究。主要特征如下:...



