临床试验描述抽取式摘要数据集

数据集概述

该数据集包含临床试验描述抽取式摘要研究相关的语料库、评估结果及代码。核心内容为过滤后的临床试验数据、生成摘要的ROUGE评分、人工评估数据与结果,以及用于语料生成的代码脚本,为临床试验文本摘要研究提供支持。

文件详解

  • 文件名称: data_and_code.zip
  • 文件格式: ZIP
  • 包含内容:
  • 语料库文件: trials-final.csv(过滤后的临床试验数据)
  • 评估结果文件: rouge-results-parsed.csv(生成摘要的ROUGE评分)
  • 人工评估数据与结果: evaluation/子文件夹(含人工评估相关数据及结果)
  • 语料生成代码: extract.r、filter.r、determine_similarity_threshold.r(R语言脚本)
  • 摘要生成代码: summarize_all.py(Python脚本)

适用场景

  • 自然语言处理研究: 用于抽取式文本摘要模型的训练与验证
  • 医学文本处理: 探索临床试验描述文本的自动化摘要生成方法
  • 评估方法研究: 分析ROUGE评分与人工评估在医学文本摘要任务中的一致性
  • 计算语言学应用: 为医疗领域专业文本的信息压缩技术提供实证数据支持
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 439.06 MiB
最后更新 2025年11月28日
创建于 2025年11月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。