PGL_SUM视频摘要预训练模型数据集

数据集概述

本数据集包含PGL-SUM网络架构的预训练模型,该架构用于视频摘要任务,结合全局与局部注意力机制及位置编码,旨在解决现有方法在长序列帧依赖建模和训练并行化方面的不足。模型在SumMe和TVSum基准数据集上验证了有效性。

文件详解

  • 压缩文件:pretrained_models.zip(ZIP格式),解压后包含以下子目录:
  • table3_models目录:含单批次训练、人工筛选的预训练模型(.pt格式),对应论文表III结果,按基准数据集(SumMe、TVSum)和数据分割(0-4)分类,文件名含训练轮次信息
  • table4_models目录:含全批次训练、自动筛选的预训练模型(.pt格式),对应论文表IV结果,按基准数据集(SumMe、TVSum)和数据分割(0-4)分类,文件名含训练轮次信息

适用场景

  • 视频摘要研究:直接使用预训练模型进行视频关键帧提取与摘要生成实验
  • 模型性能对比:基于SumMe、TVSum基准数据集复现或扩展论文中的实验结果
  • 深度学习应用:作为视频分析相关任务(如动作识别、视频检索)的预训练基础模型
  • 注意力机制研究:分析全局-局部注意力结合位置编码在序列建模任务中的效果
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 665.27 MiB
最后更新 2025年12月21日
创建于 2025年12月21日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。