字母数字识别数据集

字母数字识别数据集

数据来源:互联网公开数据

标签:字母识别,数字识别,OCR,图像处理,机器学习,数据增强,噪声处理

数据概述: 本数据集包含108,791张灰度手写字符、数字及特殊符号的图像,每张图像尺寸为24x24像素。数据集整合了三个来源:手写字符数据库、MNIST数据集以及AZ手写字母CSV格式数据。为保持一致性,所有图像均经过处理,尺寸统一调整为24x24像素,并将颜色从白底黑字反转为黑底白字。

数据组织为三个独立的ZIP文件:train.zip、test.zip和validation.zip。每个ASCII符号的图像存储在一个命名与该符号ASCII值相对应的专用文件夹中。具体文件大小如下:train.zip(55.9 MB)、test.zip(16 MB)、validation.zip(8.06 MB)。

数据用途概述: 该数据集适用于多种场景,包括文本识别、文档处理、图像分类及机器学习任务,特别适合用于OCR模型的开发、微调和优化。数据集中还包含“null”类别图像,这些图像通过注入噪声生成,模拟随机分布的亮像素,用于训练模型忽略无关区域,提升其在真实场景中的OCR任务表现。

数据与资源

附加信息

字段
版本 1.0
最后更新 四月 24, 2025, 11:40 (UTC)
创建于 四月 24, 2025, 11:36 (UTC)