数据集

自动化摘要分类与信息提取多模型框架研究数据与代码

数据集概述

本数据集为研究论文配套的公开资源，包含自动化摘要分类与信息提取多模型框架的相关数据与代码。核心内容围绕摘要干预分类、参与者数量提取两大任务展开，提供LLM推理结果、分析代码及评估标准数据，支持论文研究结果的复现与扩展。

文件详解

该数据集以ZIP压缩包形式存储，包含以下核心目录和文件： - 主目录文件： - llm_majority_public.zip：ZIP格式压缩包，包含所有研究相关的数据与代码文件 - LLM_inference目录： - abstract.csv：摘要列表CSV文件，初始含一千零八十条摘要，最终分析使用一千零二十条 - model_list.csv：LLM模型列表CSV文件，记录研究中使用的模型信息 - abstract_classification文件夹：干预分类任务相关文件，含Python推理脚本、HPC运行bash脚本、prompt提示词文件及results结果目录（含各模型CSV结果与日志） - participant_numbers文件夹：参与者数量提取任务相关文件，结构同分类任务文件夹 - gold.csv：评估标准CSV文件，含一千零二十条摘要的人工金标准、铂标准及复核标记（platine_check字段） - R_analysis目录： - analysis.R：R代码文件，用于读取LLM推理结果并计算模型组合准确率，输出结果至results目录 - figure_tables.R：R代码文件，基于分析结果生成论文图表与表格，输出至figures_tables目录 - trial_publication_info.csv：RCT研究信息CSV文件，数据来源于DOI:10.1016/j.jclinepi.2024.111586 - help_func.R：R函数文件，含表格格式化函数，供figure_tables.R调用

数据来源

gitlab.unige.ch/trial_integrity/llm_majority_public

适用场景

自然语言处理研究：复现自动化摘要分类与信息提取的多模型框架实验
模型评估：基于gold.csv的人工标准，开展LLM在医学摘要处理任务中的性能评估
计算语言学应用：探索多模型融合策略在专业文本信息提取中的优化方向
学术研究复现：支持论文"Beyond Human Gold Standards: A Multi-Model Framework..."的研究结果验证与扩展分析

数据与资源

15829040.zipZIP
6.99 MiB

下载

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	6.99 MiB
最后更新	2025年12月15日
创建于	2025年12月15日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。