找到9个数据集

标签: 标注质量分析

过滤结果
  • EHSAN可解释医疗保健情感分析NLP数据集

    2026年2月1日 30 27 11

    数据集概述 本数据集为EHSAN(可解释医疗情感标注)数据集,包含医疗领域的情感标注数据及实验代码相关文件,共6个文件,均为XLSX格式,无目录结构。数据覆盖训练、测试、验证阶段的主题与情感标注内容,以及大语言模型标注的数据集。 文件详解 Final_train_topic_and_sentiment.xlsx 文件格式:XLSX...
    packageimg
  • InfoTabS_Based_表格推理可信性证据提取标注数据集

    2026年1月29日 30 101 86

    数据集概述 本数据集为论文配套资源,包含InfoTabS数据集训练集的证据行标注结果、测试集标注结果(源自Gupta et al. 2022)、标注模板及统计信息。标注覆盖16248个训练集表格-假设对,由90名标注者完成81282条标注,多数投票一致性F1值达89.49%,支持可信表格推理的证据提取研究。 文件详解...
    packageimg
  • DCASE2024_Task9_Based_语言查询音频源分离验证集数据

    2026年1月21日 30 72 20

    数据集概述 本数据集是DCASE 2024挑战赛Task 9(语言查询音频源分离)的验证集,包含1000个来自Freesound的音频文件及对应元数据,支持模型开发阶段的性能评估。音频已处理为10秒16kHz片段,每个文件配3条人工标注字幕,标签参考FSD50K规范,可用于生成无重叠类别的合成混合音频。 文件详解 lass_validation.zip...
    packageimg
  • Bionomia_Based_卢森堡自然历史博物馆古生物收藏采集者鉴定者关联数据

    2026年1月19日 30 83 66

    数据集概述 本数据集关联了卢森堡自然历史博物馆古生物收藏中的标本数据与采集者、鉴定者信息,由志愿者通过Bionomia平台标注,基于全球生物多样性信息机构(GBIF)聚合的标本数据构建,以Frictionless Data数据包格式组织,包含9个文件。 文件详解 数据文件(.zip格式,共8个)...
    packageimg
  • Bionomia_Source_日本Odiidae科物种标本采集者与鉴定者关联数据

    2026年1月18日 30 89 24

    数据集概述 本数据集为日本采集的Odiidae科(甲壳纲:端足目)5个物种(含1新属、4新种)的标本关联数据,记录了标本采集者与鉴定者的关联信息。数据由Bionomia志愿者标注,基于GBIF聚合的标本数据集,以Frictionless Data数据包格式组织,包含9个文件,支持甲壳动物分类学研究中标本信息的追溯与管理。 文件详解 核心数据文件...
    packageimg
  • IPSP_CYPRESS_Linked_Bionomia志愿者标注的自然历史标本关联数据

    2026年1月13日 30 149 38

    数据集概述 本数据集为IPSP-CYPRESS多用途克隆数据集的关联扩展数据,包含自然历史标本与采集者、鉴定者的关联信息,由Bionomia志愿者标注生成,基于全球生物多样性信息 facility(GBIF)聚合的标本数据构建,采用Frictionless Data数据包格式,共含11个文件。 文件详解 数据包描述文件...
    packageimg
  • Bionomia_Linked_AM陆生昆虫标本采集者与鉴定者关联数据_1896_2000

    2026年1月12日 30 123 17

    数据集概述 本数据集为1896-2000年AM陆生昆虫标本的采集者与鉴定者关联数据,由Bionomia平台志愿者标注生成,基于全球生物多样性信息机构(GBIF)聚合的标本数据,以Frictionless Data数据包格式组织,包含9个相关文件。 文件详解 压缩文件(共8个)...
    packageimg
  • Reddit_Based_实体链接数据集_多标注文本语义分析完整数据

    2025年12月10日 30 111 29

    数据集概述 该数据集是基于社交媒体平台Reddit创建的实体链接数据集,包含六百一十九条帖子及一千二百四十三条对应评论,由三名人工标注者对文本分组进行标注,记录了提及-实体对及不同标注者间的一致性结果,含黄金、白银、青铜三种标注类型,总计一万一千一百零三条标注数据。 文件详解 文件名称: reddit_el.zip 文件格式: ZIP压缩包(.zip)...
    packageimg
  • SCAI_QReCC2021对话式问答共享任务结果数据集

    2025年12月4日 30 137 56

    数据集概述 本数据集为2021年SCAI-QReCC对话式问答共享任务的结果数据,基于原始QReCC数据集处理而成,包含任务数据集、答案合理性标注数据及相关压缩文件,支持对话式问答任务的研究与评估。 文件详解 任务数据集与标注文件: turns.zip:压缩文件,包含修正对话轮次编号的数据集拆分文件,如scai-qrecc21-training-...
    packageimg