生物信息学科学工作流开发的大语言模型评估数据集

本数据集包含6个PDF文件，围绕大语言模型（LLMs）在生物信息学科学工作流开发中的应用展开多维度评估，涵盖LLMs对基础概念、Galaxy与Nextflow平台的理解，以及针对具体任务生成实际工作流的能力。

基础概念评估文件：
Table-2 Fundamental_Concepts_Of_Scientific_Workflow_and_SWS.pdf：PDF格式，记录GPT-4o、Gemini 2.5 Flash、DeepSeek-V3对科学工作流及系统基础概念问题的回答，评估通用知识理解。
Table-3 LLMs Understanding of Galaxy and Nextflow.pdf：PDF格式，包含LLMs对Galaxy和Nextflow平台背景问题的回答，涉及架构、工具、可重复性及关键功能（如Galaxy ToolShed、Nextflow DSL与nf-core集成）。
工作流任务理解文件：
Table-4-workflow specific background prompts Galaxy.pdf：PDF格式，针对Galaxy平台设计的生物信息学任务背景问题，评估LLMs对域内任务（如SNP富集外显子识别、峰-基因关联）的理解。
Table-5 Workflow specific background prompts Nextflow.pdf：PDF格式，针对Nextflow平台的生物信息学任务背景问题，涉及甲基化数据处理等域内任务理解。
生成工作流展示文件：
LLMs Generated workflows using Galaxy Workflow System.pdf：PDF格式，展示LLMs基于结构化提示生成的Galaxy工作流，包含FastQC、BEDTools等工具的分步分析流程及解释。
LLMs generated workflows using Nextflow Workflow System.pdf：PDF格式，展示LLMs生成的Nextflow工作流，对比不同LLM对分析任务的结构设计、步骤序列及工具使用（如MultiQC）。

数据与资源

字段	值
作者	Maxj
版本	1
数据集大小	4.7 MiB
最后更新	2025年12月19日
创建于	2025年12月19日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。