NLPContributionGraph_SemEval2021_学术论文贡献结构化标注数据集

数据集概述

本数据集为SemEval-2021 Task 11首次发布的NLPContributionGraph任务数据,包含自然语言处理学术论文的结构化贡献标注,支持知识图谱构建。标注内容分为贡献句子、科学术语及关系、三元组三类,三元组对应ResearchProblem等12个信息单元,可集成至开放研究知识图谱等基础设施。

文件详解

  • 文件名称:test-set.zip
  • 文件格式:ZIP
  • 字段映射介绍:包含用于任务测试的NLP学术论文数据及对应标注(具体字段未提供预览)
  • 文件名称:training-set.zip
  • 文件格式:ZIP
  • 字段映射介绍:包含用于模型训练的NLP学术论文数据及对应标注(具体字段未提供预览)
  • 文件名称:trial-set.zip
  • 文件格式:ZIP
  • 字段映射介绍:包含用于任务试用的NLP学术论文数据及对应标注(具体字段未提供预览)

数据来源

SemEval-2021 Task 11: NLPContributionGraph

适用场景

  • 知识图谱构建: 利用三元组标注数据构建NLP领域学术知识图谱,支持RDF格式语义化存储
  • 学术论文贡献提取: 训练模型自动识别NLP论文中的贡献句子、科学术语及关系
  • 自然语言处理任务评测: 用于SemEval任务的模型性能评估与对比
  • 学术信息检索优化: 基于结构化贡献标注提升NLP领域论文检索的精准度
  • 科研趋势分析: 通过分析标注的ResearchProblem、Approach等信息单元,挖掘NLP领域研究热点
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 395.78 MiB
最后更新 2026年1月12日
创建于 2026年1月12日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。