找到16个数据集

格式: ZIP 标签: 实体类型

过滤结果
  • HRA支持表_样本生物结构空间本体数据

    2026年2月9日 30 75 62

    数据集概述 本数据集包含支持人类参考图谱(HRA)的三个表格数据,涵盖CCF本体、3D参考对象及注册组织数据,为医学研究提供结构化的标本、生物结构和空间实体信息,共3个文件。 文件详解 Table 1. CCFO.xlsx 文件格式:XLSX 字段映射介绍:包含每个本体的类名、属性名、实体IRI、定义(若有)和实体类型。 Table 2. 3D...
    packageimg
  • WWW2020_Based_Web表格新实体发现实验复现资源

    2026年2月8日 30 110 58

    数据集概述 本数据集是论文《Novel Entity Discovery from Web Tables》的实验复现资源,包含三个用于Web表格新实体发现、实体类型与提及解析的测试集,以及300万张表格的提及-实体、标题-属性对应关系数据,支持论文中实体链接、表格匹配、实体解析实验的复现。 文件详解 压缩包文件...
    packageimg
  • TwiBot22_Based_推特机器人检测基准数据集

    2026年1月30日 30 146 120

    数据集概述 本数据集为TwiBot-22推特机器人检测基准,包含推特、用户、列表、话题标签四类实体信息,以及训练/验证/测试划分、真实标签和网络边数据。旨在解决现有基于图的推特机器人检测数据集规模有限、结构不完整、标注质量低的问题,支持新型图基机器人检测方法的开发与评估。 文件详解 readme.md 文件格式:MD...
    packageimg
  • Elixir_Based_数据策展实践用户研究项目结果数据

    2026年1月30日 30 33 3

    数据集概述 本数据集为Elixir数据平台开展的用户研究项目结果,旨在通过观察性研究和社区调查,了解数据策展人员的工作流模式、优先关注的实体类型、论文章节及工具需求,为平台基础设施优化提供依据。包含4份文件,覆盖调查问题、结果、用户画像及访谈指南。 文件详解 Curator survey questions.docx 文件格式:DOCX...
    packageimg
  • NCI_Semantic_癌症研究数据语义能力查询审查数据

    2026年1月29日 30 111 108

    数据集概述 本数据集记录2018年5月NCI举办的语义学研讨会成果,涉及为癌症研究数据共享平台(CRDC)制定语义查询能力需求的过程。包含研讨会生成的237条初始查询、经关键词分析和分类后的82条代表性查询,以及查询与术语/本体的映射关系,用于支撑CRDC数据模型的语义需求构建。 文件详解 文件名称:CompetencyQueryReview.xlsx...
    packageimg
  • Biografischportaal_nl_荷兰传记文本命名实体识别数据集

    2026年1月21日 30 149 67

    数据集概述 本数据集用于荷兰传记文本的命名实体识别,包含六种实体类型(PERSON、LOCATION、ORGANIZATION、DATE、ARTWORK、MISC)的标注。原始数据来源于荷兰传记门户网站,标注文件经人工检查分词和句子拆分,总计包含六个文件。 文件详解...
    packageimg
  • Relation_Extraction_Based_生物与天然产物关系抽取评估数据集_test

    2026年1月11日 30 30 11

    数据集概述 本数据集是针对生物与天然产物之间关系的端到端关系抽取任务构建的人工标注评估数据集,包含对化学实体、生物实体及两者间明确关系的结构化标注,为生物信息学领域的关系抽取模型提供测试基准。 文件详解 文件名称:curated_test_set.json 文件格式:JSON 字段映射介绍:包含人工标注的实体与关系信息,主要分为三类标注内容:...
    packageimg
  • 瑞士住宅公寓模型与地理位置模拟结果数据集

    2025年12月22日 30 75 70

    数据集概述 该数据集包含瑞士约三千一百栋建筑中四万五千余套公寓(三十七万间房间)的详细数据,涵盖几何结构、房间类型,以及视域、自然光、交通噪音、中心性和几何分析等基于地理位置的模拟结果,还包括建筑的位置特征数据。 文件详解 文件名称:...
    packageimg
  • 药物基因相互作用临床意义提取数据集_FDA标签包

    2025年12月20日 30 161 109

    数据集概述 本数据集围绕从FDA批准药物标签的自由文本中提取药物基因相互作用的临床意义展开,通过大语言模型(LLMs)提取适应症、癌症类型及药物基因组学信息,并利用VICC归一化服务关联至标准化概念,补充DGIdb数据库中现有相互作用数据的治疗相关性。 文件详解 数据文件:...
    packageimg
  • DIM_PAMIR网络与活动数据集2022_2025

    2025年12月19日 30 89 5

    数据集概述 本数据集记录了2022年1月1日至2025年6月30日期间DIM PAMIR(重大兴趣领域——物质遗产、创新、实验与韧性)的活动情况,包含项目申报、资助、实体角色等结构化数据及说明文档,为了解该领域的项目与实体动态提供支持。 文件详解 文档文件: Documentation jeux de données DIM PAMIR.pdf:...
    packageimg
  • 基于本体模式的知识图谱构建基准数据集_OSKGC

    2025年12月15日 30 30 20

    数据集概述 该数据集是用于基于预定义本体模式构建知识图谱的基准数据集,包含文本-三元组-模式数据对、预定义本体模式、统一本体层次结构三个核心组件,基于WebNLG的文本-三元组对扩展构建,为相关任务提供标准化评估基础。 文件详解 文件名称: OSKGC.zip 文件格式: ZIP压缩包 包含内容: 文本-三元组-...
    packageimg
  • COVID_19相关生物医学自然语言处理词典与标注语料库工具包

    2025年12月13日 30 78 14

    数据集概述 本数据集为生物医学自然语言处理任务提供工具包,包含COVID-19相关的英文词典、标注语料库及代码工作流。词典覆盖疾病、病毒、变异株等术语,用于从CORD-19数据集提取信息,构建大型银标准语料库,辅以人工标注的金标准语料库,支持命名实体识别等文本分析任务。 文件详解...
    packageimg
  • SocialDisNER西班牙语推文疾病提及标注数据集

    2025年12月12日 30 114 69

    数据集概述 该数据集为SocialDisNER语料库,包含人工标注的西班牙语推文疾病提及金标准数据(训练集5000条、验证集2500条)及自动标注的大规模银标准数据(85000余条推文),覆盖疾病、药物等多类实体,用于研究社交媒体健康内容中的疾病提及识别。 文件详解 主数据压缩包: SocialDisNER_Data.zip 包含training-...
    packageimg
  • DIM_MAP网络与活动数据集2017_2021

    2025年12月9日 30 127 88

    数据集概述 该数据集记录了2017年1月1日至2021年12月31日期间DIM MAP(主要兴趣领域——古代材料与遗产)的活动情况,涵盖项目、实体、资金、合作等多维度信息,为研究该领域的运行模式提供数据支持。 文件详解 数据文件(CSV格式,共11个): Jeu de données DIM MAP A projets...
    packageimg
  • MEDDOPROF语料库训练集与补充实体数据集

    2025年12月5日 30 29 25

    数据集概述 该数据集为MEDDOPROF共享任务资源,包含西班牙语临床病例中职业与就业状态检测的训练数据及补充实体标注。数据集支持职业提及识别、分类和归一化三个子任务,适用于自然语言处理相关研究与应用。 文件详解 文件名称: meddoprof-training-set.zip 文件格式: ZIP压缩包 (.zip) 文件内容:...
    packageimg
  • HiDy_大型分层动态金融知识库

    2025年12月5日 30 162 24

    数据集概述 该数据集是一个分层、动态、稳健且多样化的大型金融知识库,包含三十四类关系类型、超五十六万四千四百四十四条关系、十七类实体类型及超五万一千零九十五个实体。数据按宏观、中观、微观及其他四大金融分支分层组织,持续更新以支持金融任务的模型测试。 文件详解 文件名称: data.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg