找到4个数据集

标签: 结构化标注

过滤结果
  • GitHub_开发者讨论终端用户以人为中心问题标注数据集

    2026年1月30日 30 154 3

    数据集概述 本数据集是从7个GitHub仓库中随机选取的1230条问题评论的标注数据,聚焦开发者对软件终端用户以人为中心问题的讨论内容,为研究软件开发过程中用户体验相关议题提供结构化参考。 文件详解 文件名称:GitHub Human-Centric Issues.xlsx 文件格式:XLSX...
    packageimg
  • forTEXT_Based_叙事学历史文本标注集_可供下载

    2026年1月30日 30 93 33

    数据集概述 本数据集为叙事学(历史文本方向)标注集,适用于标注文本中的叙事元素,包含历史文本内容分析的基础分类,具体用于人物与情节分析。数据集提供XML格式的标注集文件,可支持叙事文本的结构化标注工作。 文件详解 文件名称:forTEXT_Tagset_Narratologie_histoire.xml 文件格式:XML...
    packageimg
  • Relation_Extraction_Based_生物与天然产物关系抽取评估数据集_test

    2026年1月11日 30 6 3

    数据集概述 本数据集是针对生物与天然产物之间关系的端到端关系抽取任务构建的人工标注评估数据集,包含对化学实体、生物实体及两者间明确关系的结构化标注,为生物信息学领域的关系抽取模型提供测试基准。 文件详解 文件名称:curated_test_set.json 文件格式:JSON 字段映射介绍:包含人工标注的实体与关系信息,主要分为三类标注内容:...
    packageimg
  • Zenon纸草文献手写文本识别基准数据集

    2025年12月19日 30 68 48

    数据集概述 本数据集包含Zenon档案中纸草文献的基准数据,涵盖手写文本的外交转录内容,采用PageXML格式存储,适用于手写文本识别研究,共含五十九个文件,包含图片与XML两种格式。 文件详解 该数据集包含两种格式的文件,具体说明如下: - 图片文件(.jpg格式,共三十二个): -...
    packageimg