-
瑞士住宅公寓模型与地理位置模拟结果数据集
2025年12月22日 30 190 33
数据集概述 该数据集包含瑞士约三千一百栋建筑中四万五千余套公寓(三十七万间房间)的详细数据,涵盖几何结构、房间类型,以及视域、自然光、交通噪音、中心性和几何分析等基于地理位置的模拟结果,还包括建筑的位置特征数据。 文件详解 文件名称:...
-
药物基因相互作用临床意义提取数据集_FDA标签包
2025年12月20日 30 115 53
数据集概述 本数据集围绕从FDA批准药物标签的自由文本中提取药物基因相互作用的临床意义展开,通过大语言模型(LLMs)提取适应症、癌症类型及药物基因组学信息,并利用VICC归一化服务关联至标准化概念,补充DGIdb数据库中现有相互作用数据的治疗相关性。 文件详解 数据文件:...
-
DIM_PAMIR网络与活动数据集2022_2025
2025年12月19日 30 82 81
数据集概述 本数据集记录了2022年1月1日至2025年6月30日期间DIM PAMIR(重大兴趣领域——物质遗产、创新、实验与韧性)的活动情况,包含项目申报、资助、实体角色等结构化数据及说明文档,为了解该领域的项目与实体动态提供支持。 文件详解 文档文件: Documentation jeux de données DIM PAMIR.pdf:...
-
基于本体模式的知识图谱构建基准数据集_OSKGC
2025年12月15日 30 113 66
数据集概述 该数据集是用于基于预定义本体模式构建知识图谱的基准数据集,包含文本-三元组-模式数据对、预定义本体模式、统一本体层次结构三个核心组件,基于WebNLG的文本-三元组对扩展构建,为相关任务提供标准化评估基础。 文件详解 文件名称: OSKGC.zip 文件格式: ZIP压缩包 包含内容: 文本-三元组-...
-
COVID_19相关生物医学自然语言处理词典与标注语料库工具包
2025年12月13日 30 119 104
数据集概述 本数据集为生物医学自然语言处理任务提供工具包,包含COVID-19相关的英文词典、标注语料库及代码工作流。词典覆盖疾病、病毒、变异株等术语,用于从CORD-19数据集提取信息,构建大型银标准语料库,辅以人工标注的金标准语料库,支持命名实体识别等文本分析任务。 文件详解...
-
SocialDisNER西班牙语推文疾病提及标注数据集
2025年12月12日 30 15 5
数据集概述 该数据集为SocialDisNER语料库,包含人工标注的西班牙语推文疾病提及金标准数据(训练集5000条、验证集2500条)及自动标注的大规模银标准数据(85000余条推文),覆盖疾病、药物等多类实体,用于研究社交媒体健康内容中的疾病提及识别。 文件详解 主数据压缩包: SocialDisNER_Data.zip 包含training-...
-
DIM_MAP网络与活动数据集2017_2021
2025年12月9日 30 183 103
数据集概述 该数据集记录了2017年1月1日至2021年12月31日期间DIM MAP(主要兴趣领域——古代材料与遗产)的活动情况,涵盖项目、实体、资金、合作等多维度信息,为研究该领域的运行模式提供数据支持。 文件详解 数据文件(CSV格式,共11个): Jeu de données DIM MAP A projets...
-
MEDDOPROF语料库训练集与补充实体数据集
2025年12月5日 30 3 0
数据集概述 该数据集为MEDDOPROF共享任务资源,包含西班牙语临床病例中职业与就业状态检测的训练数据及补充实体标注。数据集支持职业提及识别、分类和归一化三个子任务,适用于自然语言处理相关研究与应用。 文件详解 文件名称: meddoprof-training-set.zip 文件格式: ZIP压缩包 (.zip) 文件内容:...
-
HiDy_大型分层动态金融知识库
2025年12月5日 30 8 1
数据集概述 该数据集是一个分层、动态、稳健且多样化的大型金融知识库,包含三十四类关系类型、超五十六万四千四百四十四条关系、十七类实体类型及超五万一千零九十五个实体。数据按宏观、中观、微观及其他四大金融分支分层组织,持续更新以支持金融任务的模型测试。 文件详解 文件名称: data.zip 文件格式: ZIP压缩包 内容说明:...



