CA_SUM_Based_视频摘要预训练模型数据_ICMR2022

数据集概述

本数据集包含CA-SUM网络架构的预训练模型,该架构用于无监督视频摘要任务,源自ICMR 2022论文提出的方法。模型通过集中注意力机制结合帧的独特性与多样性估计,提升摘要质量,支持基于SumMe和TVSum基准数据集的推理应用。

文件详解

  • 压缩包文件:pretrained_models.zip
  • 文件格式:ZIP
  • 内容结构:解压后生成pretrained_models文件夹,包含SumMe和TVSum两个子目录(对应两个基准数据集);每个子目录下有split0-split4共5个数据分割的预训练模型文件(.pt格式),文件名包含训练轮次和长度正则化因子信息。

数据来源

Zenodo平台(论文关联资源),论文标题“Summarizing Videos using Concentrated Attention and Considering the Uniqueness and Diversity of the Video Frames”

适用场景

  • 无监督视频摘要研究:用于测试CA-SUM模型在视频摘要任务中的性能,对比不同基准数据集的结果。
  • 模型复现与验证:支持基于SumMe、TVSum数据集的模型推理,复现论文实验结果。
  • 视频摘要算法优化:通过分析预训练模型的结构与参数,优化集中注意力机制或帧特征估计方法。
  • 计算机视觉教学演示:作为视频摘要领域的典型模型案例,用于相关技术的教学与实践。
packageimg

数据与资源

该数据集没有数据

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.0 MiB
最后更新 2026年1月27日
创建于 2026年1月27日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。