乌尔都语OCR特征向量数据集

乌尔都语OCR特征向量数据集 数据来源:互联网公开数据
标签:乌尔都语,OCR,特征向量,连字识别,Nastalique字体,机器学习,模式识别
数据概述:
本数据集包含乌尔都语Nastalique字体下1至4个字符的连字特征向量,以CSV和MAT格式存储。CSV文件每个类别包含1个模板和5个测试实例,MAT文件每个类别包含30个实例。数据集共收录2,647个独特的连字类别,其中1个字符的连字17个,2个字符的连字182个,3个字符的连字892个,4个字符的连字1,556个,总类別数为2,647个。
数据用途概述:
该数据集适用于乌尔都语OCR模型训练、特征提取研究、机器学习算法评估等领域。研究者可利用数据集进行OCR决策模型开发、连字识别算法优化及模式识别算法测试。此外,数据集可为乌尔都语文本处理和多语言OCR系统提供支持,助力提升OCR技术在复杂字体和连字场景下的性能。

数据与资源

附加信息

字段
版本 1.0
最后更新 五月 31, 2025, 16:50 (UTC)
创建于 五月 31, 2025, 16:49 (UTC)