DISCERN_Based_中文健康信息质量评估完整标注数据

数据集概述

该数据集为DISCERN标注数据集,包含收集的中文健康信息文本、网页元数据、DISCERN评分结果及补充文件,涉及校准示例、评分者信度、标注指南等内容,为健康信息质量评估研究提供数据支持。

文件详解

  • 数据文件(.xlsx格式):
  • Webpage meta.xlsx:网页元数据文件
  • rater1.xlsx:第一位评分者的DISCERN评分数据
  • rater2.xlsx:第二位评分者的DISCERN评分数据
  • rater3.xlsx:第三位评分者的DISCERN评分数据
  • consensus scores.xlsx:共识DISCERN评分数据
  • 文档文件(.docx格式):
  • Disagreement pattern.docx:评分者分歧模式说明文档
  • 压缩文件(.zip格式):
  • texts.zip:收集的在线中文健康信息文本压缩包
  • Supplementary files.zip:补充文件压缩包,包含校准示例、评分者信度指标、标注指南、代码等内容

适用场景

  • 健康信息质量评估研究:基于DISCERN评分分析中文健康信息文本的质量特征
  • 自然语言处理应用:用于训练或验证健康文本质量评估的NLP模型
  • 评分者信度分析:研究多评分者对健康信息质量评估的一致性与分歧模式
  • 医疗信息学研究:探索网页元数据与健康信息质量的关联关系
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 8.47 MiB
最后更新 2025年12月15日
创建于 2025年12月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。