沙特阿拉伯学童手写阿拉伯字母识别数据集-2019-mohamedgreshamahdi
数据来源:互联网公开数据
标签:阿拉伯字母,手写识别,学童,教育数据,沙特阿拉伯,机器学习,图像识别,数据集
数据概述:
本数据集包含从2019年1月至4月期间在沙特阿拉伯利雅得收集的7至12岁阿拉伯语学校儿童手写阿拉伯字母数据。数据集共包括47,434个字符,由591名参与者书写的不同形式的字母组成。数据集涵盖了29个阿拉伯字母,其中包含一个专门的“hamza”文件夹。每个字母文件夹下进一步分为不同的字母形式子文件夹,每个子文件夹包含相应字母形式的图像。数据集中不包含表示元音和其他无法用阿拉伯字母表示的声音的声调符号(哈拉卡特)。
数据集包含4个文件,字母按字母顺序排列:
X_train.csv:训练集,包含37,933行数据
y_train.csv:训练集标签,包含37,933行数据
X_test.csv:测试集,包含9,501行数据
y_test.csv:测试集标签,包含9,501行数据
贡献者:
Najwa Altwaijry, Monera Al-Megren, Haya Al-Shumisi, Lamya Al-Arwan, 和 Isra Al-Turaiki
电子邮箱:ialturaiki@ksu.edu.sa
数据用途概述:
该数据集适用于阿拉伯字母手写识别系统的开发和训练,教育数据分析,以及机器学习模型的评估。研究人员可以利用此数据集进行手写体识别算法的训练和测试;教育部门可以利用此数据了解学童的书写习惯和能力;也能用于开发相关的教育工具和应用程序。该数据集为阿拉伯语教育和手写识别技术的研究提供了有价值的数据资源。