-
MEDDOPLACE医疗文档地点相关内容抽取黄金标准标注语料库
2025年12月14日 30 194 144
数据集概述 该数据集是MEDDOPLACE任务的黄金标准标注语料库,聚焦西班牙语医疗文档中地点相关内容的抽取,包含地点检测、归一化、分类及临床科室、国籍、患者流动等关联信息的标注,适用于生物医学自然语言处理研究。 文件详解 文件名称: meddoplace_train+test+gazz+crossmap+multilingual_231003.zip...
-
Reddit_Based_实体链接数据集_多标注文本语义分析完整数据
2025年12月10日 30 142 139
数据集概述 该数据集是基于社交媒体平台Reddit创建的实体链接数据集,包含六百一十九条帖子及一千二百四十三条对应评论,由三名人工标注者对文本分组进行标注,记录了提及-实体对及不同标注者间的一致性结果,含黄金、白银、青铜三种标注类型,总计一万一千一百零三条标注数据。 文件详解 文件名称: reddit_el.zip 文件格式: ZIP压缩包(.zip)...
-
西班牙语COVID_19推文职业检测黄金标准标注数据集2021
2025年12月6日 30 76 4
数据集概述 本数据集包含一万条带黄金标准标注的西班牙语COVID-19推文,按训练集、验证集、测试集以六十比二十比二十比例划分,涵盖职业分类与命名实体识别两个子任务的标注数据,同时提供多格式文件及工具脚本,支持自然语言处理模型训练与评估。 文件详解 数据集为压缩包格式,包含两个子任务相关文件,具体说明如下: - subtask-1(职业分类子任务):...



