找到3个数据集

标签: 章节标题

过滤结果
  • YouTube_RAI_官方频道视频分段数据集_训练测试集

    2026年1月29日 30 192 164

    数据集概述 本数据集包含YouTube官方RAI频道(https://www.youtube.com/@rai)中时长超过5分钟的视频信息,涵盖视频ID、标题及分段数据。每个视频的分段数据以列表形式记录各章节的开始时间(毫秒)和章节标题,数据集分为训练集与测试集两个不重叠的部分。 文件详解 文件名称:train_yt_over5min.json...
    packageimg
  • Normalized_4000部中国地方志标准化章节标题数据

    2026年1月29日 30 142 70

    数据集概述 本数据集包含四千部中国地方志的标准化章节标题相关数据,涵盖地方志的元数据、矩阵数据及投影配置信息,可用于地方志文献的结构化分析与研究,总计包含三个文件。 文件详解 all_books_metadata.csv 文件格式:CSV 字段映射介绍:包含Book ID(地方志ID)、Book Name(地方志名称)、Admin...
    packageimg
  • MarkupMnA_并购协议标注数据集

    2025年12月15日 30 205 159

    数据集概述 该数据集包含151份美国上市公司并购协议的标注语料,基于SEC EDGAR数据库的HTML filings,添加了章节标题、章节号、页码等标注,采用BEIOS标签方案。旨在支持法律合同长文档的层级表示研究,可与MAUD数据集结合用于法律NLP研究。 文件详解 压缩包文件:...
    packageimg