找到4个数据集

分类: 公开数据 标签: Schemaorg

过滤结果
  • Crosswalk_Based_开放科学常用元数据方案互操作性对照表

    2026年1月23日 30 208 73

    数据集概述 本数据集提供开放科学领域常用元数据方案与指南之间的对照表(crosswalks),覆盖RDA元数据推荐集、EOSC EDMI元数据集、Dublin CORE、Datacite、DCAT、EUDAT B2Find、OpenAIRE系列指南、Crossref、Harvard Dataverse、DDI、Europeana...
    packageimg
  • GitTables_Based_SemTab_2022列类型检测基准数据集

    2026年1月21日 30 196 159

    数据集概述 本数据集是GitTables语料库的子集,专为2022年SemTab竞赛第三轮的列类型检测方法基准测试而整理。包含表格数据文件及对应DBpedia、Schema.org的目标列标注与真值文件,共七个文件,用于评估表格列语义类型检测模型的性能。 文件详解 文件名称:GitTables_SemTab_2022_dataset.zip...
    packageimg
  • GitTables基准测试_列类型检测数据集

    2025年12月20日 30 58 57

    数据集概述 本数据集是GitTables语料库的一个子集,专为列类型检测方法的基准测试设计。它基于DBpedia和Schema.org本体的语义类型,用于评估系统对表格列进行语义标注的能力,曾用于SemTab 2021挑战赛的CTA任务。数据集包含表格样本、目标列信息、标注真值及标签映射文件,支持列类型检测模型的训练与评估。 文件详解...
    packageimg
  • OntoLAMA本体包含推理语言模型分析数据集

    2025年12月6日 30 106 7

    数据集概述 该数据集是用于本体包含推理(SI)的语言模型探测数据集,基于Schema.org、DOID、FoodOn、GO等真实本体构建,分为原子SI(仅原子概念)和复杂SI(含原子与复杂概念)任务,含多领域多规模的训练/验证/测试数据。 文件详解 压缩文件集合(共8个.zip格式文件): schemaorg-atomic-...
    packageimg