Exomiser与七种大语言模型差异诊断基准测试补充数据集

数据集概述

本数据集为Exomiser工具与七种大语言模型(含GPT系列、Gemini Flash 2.0等)在基于表型数据包(phenopackets)的差异诊断任务中的基准测试补充数据,包含模型响应、表型数据包及结果文件。

文件详解

  • correct_results.tsv:TSV格式文件,包含差异诊断的正确结果数据,示例字段涉及疾病名称(如神经发育障碍伴颅内出血等)、OMIM编号、PMID及个体ID相关的提示文本。
  • phenopackets.tar.gz:GZ压缩格式文件,可能包含用于差异诊断任务的表型数据包原始或处理数据。
  • prompts.tar.gz:GZ压缩格式文件,可能包含用于测试模型的提示文本数据。
  • all_models_responses.zip:ZIP压缩格式文件,可能包含所有参与测试模型的响应结果数据。

适用场景

  • 医学人工智能研究:评估不同大语言模型在临床差异诊断任务中的性能
  • 生物信息学工具对比:分析Exomiser与大语言模型在表型数据解析中的差异
  • 医疗诊断辅助系统开发:为构建基于AI的临床决策支持工具提供基准测试参考
  • 自然语言处理在医疗领域应用:研究大语言模型处理医学表型文本的能力
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 13.94 MiB
最后更新 2025年12月9日
创建于 2025年12月9日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。