-
金融新闻文本挖掘平行语料库数据集2007_2020
2025年12月15日 30 189 174
数据集概述 本数据集为金融领域的英汉平行新闻语料库,包含2007至2020年的60,473篇双语文档,涵盖新闻的标题、正文等核心内容,可用于金融领域的平行双语文本挖掘研究。 文件详解 文件名称:FT-en-zh.rar 文件格式:RAR压缩包...
-
德国大学医学中心2009_2017年完成临床试验结果传播研究数据集
2025年12月15日 30 112 60
数据集概述 该数据集收录2009至2017年德国35所大学医学中心(UMC)相关的临床试验数据,涵盖DRKS与ClinicalTrials.gov两大注册平台,包含试验基本信息、结果发表状态及手动检索的发表文献信息,支持研究临床试验结果传播情况。 文件详解 文件名称: raw-registries.zip,文件格式:...
-
数据2020年人畜共患病数据报告Excel映射工具集
2025年12月15日 30 194 29
数据集概述 该数据集包含一套Excel映射工具,用于支持成员国及报告国家将本国标准术语映射至欧洲食品安全局(EFSA)术语体系,并生成XML文件以通过数据收集框架(DCF)提交人畜共患病监测数据。工具覆盖七种数据模型,提供动态或手动版本选择,同时包含多房棘球绦虫数据专用工具及操作说明。 文件详解 数据模型映射工具(.xls格式,共12个文件):...
-
模型溯源术语映射表
2025年12月11日 30 178 118
数据集概述 本数据集包含模型溯源术语映射表,基于论文《Cutting through the Jungle: Disambiguating Model-based Traceability Terminology》开发,将模型溯源术语与用于术语验证的一级、二级来源进行对应,为术语标准化提供数据支持。 文件详解 该数据集包含3个文件,具体说明如下: -...
-
疾病本体术语与维基数据多语言映射数据集2020
2025年12月9日 30 12 11
数据集概述 本数据集包含2020年2月13日通过维基数据查询服务获取的1000个疾病本体术语及其维基数据映射,覆盖英语及印地语、孟加拉语等十七种主要印度语言,旨在评估非英语语言疾病相关术语的覆盖进展。 文件详解 SPARQL.txt:文本格式,存储用于获取数据的SPARQL查询语句,包含疾病本体ID筛选、多语言标签获取等查询逻辑。...
-
CodiEsp任务有效CIE10编码数据集
2025年12月9日 30 107 2
数据集概述 本数据集为CodiEsp任务提供2018版CIE10诊断与手术编码列表,包含西班牙语及部分英语描述,覆盖诊断编码(D)和手术编码(P),后者含第四轴编码,支持非英语临床案例的自动编码研究。 文件详解 压缩包文件:codiesp_codes.zip(ZIP格式),包含以下两个TSV文件 codiesp-...
-
西班牙语医学缩写数据库AbreMES_DB
2025年12月5日 30 160 159
数据集概述 该数据集是西班牙语医学缩写数据库(AbreMES-DB),通过自动检测生物医学出版物元数据中缩写及其同句显式定义构建,旨在形成用于缩写定义解析的语义资源库。 文件详解 文件名称: AbreMES-DB.zip 文件格式: ZIP压缩包(.zip) 内容说明:...
-
DisTEMIST西班牙语临床病例疾病提及检测与标准化数据集
2025年12月4日 30 197 162
数据集概述 本数据集为DisTEMIST语料库,包含一千份西班牙语临床病例,病例中的疾病提及经人工标注并映射至SNOMED-CT概念。数据集分为训练集、测试集、背景集,同时提供多语言资源和跨术语映射文件,支持疾病实体检测与标准化相关研究。 文件详解 数据集以压缩包形式提供,核心内容包含以下目录与文件: - 主文件: -...
-
SympTEMIST症状体征信息抽取标注数据集
2025年12月4日 30 17 0
数据集概述 该数据集是针对西班牙语文档中症状、体征和检查结果进行信息抽取的标注资源,包含任务训练测试集、SNOMED术语词表、九种语言的银标准数据及一万五千余例临床病例背景集,为医学文本挖掘研究提供标准化标注数据。 文件详解 文件名称: symptemist-complete_240208.zip 文件格式: ZIP压缩包 包含内容:...



