CountCLIP_Based_图像计数任务训练数据集

数据集概述

本数据集为CountCLIP项目构建,包含约两千张计数图像与约一万三千张非计数图像,合并自原始数据集的两百万余张图像筛选结果。数据集提供融合后的数据压缩包及相关JSON、CSV文件,可用于训练CLIP模型的计数能力,支持图像计数任务的模型开发与验证。

文件详解

  • data.zip
  • 文件格式:ZIP
  • 内容介绍:包含合并后的计数与非计数图像数据,以及验证数据集CountBench
  • merged.json
  • 文件格式:JSON
  • 内容介绍:计数与非计数图像融合后的数据集描述文件
  • val.json
  • 文件格式:JSON
  • 内容介绍:CountBench验证数据集的描述文件
  • faulty.csv
  • 文件格式:CSV
  • 字段映射:包含index(索引)、json_str(JSON字符串,记录图像路径pths、描述caps、链接urls等信息),用于标记需移除的错误非计数图像

适用场景

  • 图像计数模型训练:用于训练CLIP模型实现从1到10的计数能力
  • 多模态模型优化:通过计数与非计数图像数据提升模型对视觉内容的数量感知能力
  • 计算机视觉任务验证:利用CountBench验证集评估图像计数模型的性能
  • 数据集清洗研究:基于faulty.csv分析非计数图像数据中的错误类型及处理方法
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 918.27 MiB
最后更新 2026年2月7日
创建于 2026年2月7日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。