数据集

字母数字识别数据集

数据来源：互联网公开数据

标签：字母识别,数字识别,OCR,图像处理,机器学习,数据增强,噪声处理

数据概述：本数据集包含108,791张灰度手写字符、数字及特殊符号的图像，每张图像尺寸为24x24像素。数据集整合了三个来源：手写字符数据库、MNIST数据集以及AZ手写字母CSV格式数据。为保持一致性，所有图像均经过处理，尺寸统一调整为24x24像素，并将颜色从白底黑字反转为黑底白字。

数据组织为三个独立的ZIP文件：train.zip、test.zip和validation.zip。每个ASCII符号的图像存储在一个命名与该符号ASCII值相对应的专用文件夹中。具体文件大小如下：train.zip（55.9 MB）、test.zip（16 MB）、validation.zip（8.06 MB）。

数据用途概述：该数据集适用于多种场景，包括文本识别、文档处理、图像分类及机器学习任务，特别适合用于OCR模型的开发、微调和优化。数据集中还包含“null”类别图像，这些图像通过注入噪声生成，模拟随机分布的亮像素，用于训练模型忽略无关区域，提升其在真实场景中的OCR任务表现。

数据与资源

字母数字识别数据集.zipZIP
77.94 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	77.94 MiB
最后更新	2025年4月24日
创建于	2025年4月24日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

字母数字识别数据集

数据与资源

附加信息

注册成功！