-
媒体偏见标注专家数据集
数据集概述 本数据集聚焦媒体偏见检测,通过对比众包标注与专家标注的差异,验证专家标注对提升数据质量的作用。数据包含专家标注结果、众包原始数据及标注指南,旨在为偏见检测模型提供更可靠的基准数据,解决现有偏见语料库标注一致性低的问题。 文件详解 专家标注文件: annotations_expert1.xlsx:...
-
右心房分割数据集
数据集概述 本数据集为右心房(RA)分割研究提供支持,包含154份高分辨率晚期钆增强磁共振成像(LGE-MRI)扫描数据,每份均经医学专家众包标注标准化处理,确保像素级标注的准确性与一致性,可用于训练AI分割模型。 文件详解 文件名称:RAS_154.zip 文件格式:ZIP压缩包 内容说明:包含154份带像素级标注的高分辨率LGE-...
-
古希腊语到英语翻译对齐标注指南与黄金标准数据集
数据集概述 该数据集包含古希腊语文本与英语翻译对齐的标注指南及黄金标准,标注覆盖荷马史诗、雅典散文、柏拉图对话等文本,经测试标注者间一致性达百分之八十及以上,可用于翻译对齐的执行、评估及自动化模型训练。 文件详解 文件名称: eng.txt 文件格式: TXT (.txt) 内容说明:...
-
Reddit_Based_实体链接数据集_多标注文本语义分析完整数据
数据集概述 该数据集是基于社交媒体平台Reddit创建的实体链接数据集,包含六百一十九条帖子及一千二百四十三条对应评论,由三名人工标注者对文本分组进行标注,记录了提及-实体对及不同标注者间的一致性结果,含黄金、白银、青铜三种标注类型,总计一万一千一百零三条标注数据。 文件详解 文件名称: reddit_el.zip 文件格式: ZIP压缩包(.zip)...
-
PMB_VID_德语动词性潜在习语表达式标注数据集
数据集概述 该数据集包含Parallel Meaning Bank中德语动词性潜在习语表达式(PIEs)的标注数据,配套Ehren等人2024年的研究。涵盖多类文件,为分析德语习语表达提供结构化标注及分析工具支持。 文件详解 文档类文件: README.md:Markdown格式,数据集说明文档,含使用方法及参考文献 Annotation...
-
加泰罗尼亚语语义文本相似度基准数据集1_0_2
数据集概述 该数据集是用于评估加泰罗尼亚语语义文本相似度(STS)的基准语料库,包含三千余对人工标注的句子对,标注遵循SemEval挑战指南,基于0到5分的相似度评分标准,为语义相似度模型的构建与评估提供支持。 文件详解 文件名称:STS-ca_v.1.0.2.zip 文件格式:ZIP压缩包...
-
德国联邦宪法法院比例原则判决标注数据集
数据集概述 本数据集包含德国联邦宪法法院300份判决的句子级比例原则测试标注,每份判决经至少两人标注,分歧由专家确定黄金标准。提供个人标注、黄金标准及合并数据集,含详细文档说明。 文件详解 文档说明文件: Lüders_vhmk-data-description.pdf: PDF格式,提供数据集详细说明 压缩文件: guidelines.zip:...
-
SCAI_QReCC2021对话式问答共享任务结果数据集
数据集概述 本数据集为2021年SCAI-QReCC对话式问答共享任务的结果数据,基于原始QReCC数据集处理而成,包含任务数据集、答案合理性标注数据及相关压缩文件,支持对话式问答任务的研究与评估。 文件详解 任务数据集与标注文件: turns.zip:压缩文件,包含修正对话轮次编号的数据集拆分文件,如scai-qrecc21-training-...
-
图像标注数据分析数据集ImageAnnotationDataAnalysis-steubk
图像标注数据分析数据集ImageAnnotationDataAnalysis-steubk 数据来源:互联网公开数据 标签:图像标注, 数据标注, 计算机视觉, 标注质量, 标注一致性, 深度学习, 数据集评估, 数据增强 数据概述:...



