长尾异常检测数据集2024

数据集概述

该数据集为长尾异常检测(LTAD)研究提供了数据拆分方案,基于MVTec、VisA和DAGM三个公开数据集构建不同不平衡类型的长尾拆分。核心用于评估异常检测模型在类不平衡场景下的性能,支持CVPR 2024论文“Long-Tailed Anomaly Detection with Learnable Class Names”的复现与后续研究。

文件详解

  • 根目录文件:
  • README.md:Markdown格式的说明文档,介绍数据集背景、结构及使用方法
  • 数据集拆分目录(dataset_split/):
  • dagm_lt/:DAGM数据集的长尾拆分文件夹,包含不同不平衡类型(指数、阶梯等)的子目录
  • mvtec_lt/:MVTec数据集的长尾拆分文件夹,结构同上
  • visa_lt/:VisA数据集的长尾拆分文件夹,结构同上
  • 子目录文件(以visa_lt/exp/100/为例):
  • train.json:训练集元数据文件,包含字段:filename(图像路径)、label(0为正常/1为缺陷)、label_name(标签名称)、clsname(类别名称)
  • test.json:测试集元数据文件,在训练集字段基础上增加maskname(缺陷区域掩码路径)

数据来源

Mitsubishi Electric Research Laboratories (MERL)

适用场景

  • 计算机视觉研究:评估异常检测模型在长尾分布场景下的鲁棒性
  • 工业质检应用:研究类不平衡工业缺陷检测的算法优化方向
  • 论文复现验证:复现CVPR 2024相关长尾异常检测研究的实验结果
  • 模型基准测试:构建长尾异常检测任务的统一性能评估基准
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.42 MiB
最后更新 2025年12月26日
创建于 2025年12月23日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。