数据集

复制包开发者聊天摘要_LLM评估数据

数据集概述

本数据集是论文《Evaluating Large Language Models in Summarizing Developer Chat Conversations: A Linguistic Perspective》的复现包，包含开发者聊天对话的人工优质摘要（黄金集）、LLM生成摘要，以及两者的语言学分析结果，同时提供语言学分析的Python脚本，共4个文件，支持对LLM对话摘要能力的复现评估。

文件详解

黄金集数据文件
文件名称：GoldenSet.xlsx
文件格式：XLSX
字段映射介绍：包含各开发者聊天对话对应的参与者最佳人工摘要（黄金集）及LLM生成摘要
人工摘要语言学分析文件
文件名称：LinguisticAnalysis_HumanGenerated.xlsx
文件格式：XLSX
字段映射介绍：包含人工优质摘要（黄金集）的语言学分析结果，如词性标签、实体等
LLM生成摘要语言学分析文件
文件名称：LinguisticAnalysis_LLMGenerated.xlsx
文件格式：XLSX
字段映射介绍：包含LLM生成摘要的语言学分析结果，如词性标签、实体等
语言学分析代码文件
文件名称：POS_TAGGING_AND_TEXT_ANALYSIS_Abstractive_Summaries.ipynb
文件格式：IPYNB
字段映射介绍：用于运行语言学分析的Python脚本（Jupyter Notebook格式）

数据来源

论文《Evaluating Large Language Models in Summarizing Developer Chat Conversations: A Linguistic Perspective》的复现包

适用场景

LLM对话摘要能力评估: 对比人工黄金集与LLM生成摘要，评估LLM在开发者聊天对话场景下的摘要质量
摘要语言学特征研究: 分析人工与LLM摘要的词性、实体等语言学特征差异
自然语言处理模型优化: 基于语言学分析结果，优化LLM对话摘要的生成策略
论文研究复现: 支持对原论文中LLM摘要评估实验的完整复现与验证

数据与资源

14791485.zipZIP
5.95 MiB

下载

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	5.95 MiB
最后更新	2026年2月15日
创建于	2026年2月15日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。