人类活动图像描述数据集

数据集概述

该数据集包含人类执行多种活动的图像及对应描述,涉及行走、跑步、睡眠、游泳等十种活动类型,共230个文件,以.jpg格式为主,辅以少量.jpeg图像和一个文本描述文件。

文件详解

  • 图像文件(共229个):
  • 格式:.jpg(222个)、.jpeg(7个)
  • 内容:展示人类执行不同活动的图像,文件命名示例包括214_reading.jpg、041_walking.jpg、013_sleeping.jpg等
  • 文本文件(共1个):
  • 文件名称:captions.txt
  • 格式:.txt
  • 内容:包含图像对应的描述文本,每条记录格式为“图像文件名#序号 描述内容”,示例:000_sleeping.jpg#0 A little girl sleeping in her bed .

适用场景

  • 计算机视觉研究:用于图像描述模型的训练与评估
  • 行为识别分析:探索人类活动图像特征与文本描述的关联
  • 自然语言处理:研究图像内容到自然语言的转换机制
  • 多模态学习:支持图像与文本跨模态任务的算法开发
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 37.65 MiB
最后更新 2025年12月23日
创建于 2025年12月23日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。