会议摘要基准数据集MeetingBank

数据集概述

该数据集是用于会议摘要任务的基准数据集,基于美国6个主要城市议会会议构建,包含1,366场会议的视频、转录文本、会议记录PDF、议程及元数据,提供6,892个段落级摘要实例,为会议摘要模型训练与评估提供支持。

文件详解

  • 文件名称: MeetingBank.zip
  • 文件格式: ZIP压缩包
  • 内容说明: 压缩包内包含美国6个主要城市议会会议的相关数据,具体包含视频文件、转录文本、会议记录PDF文档、议程文件及其他元数据,总计1,366场会议数据与6,892个段落级摘要实例。

适用场景

  • 自然语言处理研究: 用于会议摘要模型的训练、评估与性能测试
  • 多模态信息处理: 探索视频、文本等多模态数据融合的会议内容结构化提取方法
  • 文档分析应用: 研究长文本(平均28k tokens)的自动摘要与关键信息提取技术
  • 公共事务数据分析: 辅助城市议会会议内容的快速理解与信息检索
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 607.56 MiB
最后更新 2025年12月19日
创建于 2025年12月19日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。