复制包开发者聊天摘要_LLM评估数据

数据集概述

本数据集是论文《Evaluating Large Language Models in Summarizing Developer Chat Conversations: A Linguistic Perspective》的复现包,包含开发者聊天对话的人工优质摘要(黄金集)、LLM生成摘要,以及两者的语言学分析结果,同时提供语言学分析的Python脚本,共4个文件,支持对LLM对话摘要能力的复现评估。

文件详解

  • 黄金集数据文件
  • 文件名称:GoldenSet.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:包含各开发者聊天对话对应的参与者最佳人工摘要(黄金集)及LLM生成摘要
  • 人工摘要语言学分析文件
  • 文件名称:LinguisticAnalysis_HumanGenerated.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:包含人工优质摘要(黄金集)的语言学分析结果,如词性标签、实体等
  • LLM生成摘要语言学分析文件
  • 文件名称:LinguisticAnalysis_LLMGenerated.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:包含LLM生成摘要的语言学分析结果,如词性标签、实体等
  • 语言学分析代码文件
  • 文件名称:POS_TAGGING_AND_TEXT_ANALYSIS_Abstractive_Summaries.ipynb
  • 文件格式:IPYNB
  • 字段映射介绍:用于运行语言学分析的Python脚本(Jupyter Notebook格式)

数据来源

论文《Evaluating Large Language Models in Summarizing Developer Chat Conversations: A Linguistic Perspective》的复现包

适用场景

  • LLM对话摘要能力评估: 对比人工黄金集与LLM生成摘要,评估LLM在开发者聊天对话场景下的摘要质量
  • 摘要语言学特征研究: 分析人工与LLM摘要的词性、实体等语言学特征差异
  • 自然语言处理模型优化: 基于语言学分析结果,优化LLM对话摘要的生成策略
  • 论文研究复现: 支持对原论文中LLM摘要评估实验的完整复现与验证
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 5.95 MiB
最后更新 2026年2月15日
创建于 2026年2月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。