ToxHabits_NER_毒性习惯场景命名实体识别标注数据集

数据集概述

该数据集是西班牙语临床文本中“毒性习惯”命名实体识别的标注数据,聚焦烟草使用、酒精消费、非法药物使用等实体的检测与分类,含训练集和测试集,为临床及流行病学研究提供标注资源。

文件详解

  • 训练集文件:
  • ToxHabits(ToxNER)_Train_ANNFiles.zip:ZIP格式,包含ToxNER任务的训练集标注文件
  • ToxHabits(ToxUse)_Train_ANNFiles.zip:ZIP格式,包含ToxUse任务的训练集标注文件
  • 测试集文件:
  • ToxHabits(ToxNER)_Test_ANNFiles.zip:ZIP格式,包含ToxNER任务的测试集标注文件
  • ToxHabits(ToxUse)_Test_ANNFiles.zip:ZIP格式,包含ToxUse任务的测试集标注文件

数据来源

巴塞罗那超级计算中心NLP for Biomedical Information Analysis团队

适用场景

  • 生物医学NLP研究:用于毒性习惯命名实体识别模型的训练与评估
  • 临床文本分析:从西班牙语病历中提取毒性习惯相关实体
  • 流行病学研究:支持毒性行为相关数据的自动化提取与统计
  • 医学信息标准化:推进临床文本中健康风险因素的规范化标注研究
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 8.21 MiB
最后更新 2025年12月15日
创建于 2025年12月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。