数据集概述
本数据集包含819份手写表单,由不同教育背景和年龄(11岁至60多岁)的志愿者书写,包括希伯来语母语者和非母语者。表单有50种变体,每份平均含62个单词。数据集随机分为训练集(80%)、验证集(10%)和测试集(10%),用于手写图像性别分类研究。
文件详解
- 文件名称:
HHD_gender.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包内包含819份手写表单数据,具体字段未提供,但根据描述,数据主要为手写文本图像,可能包含与性别分类相关的特征信息。
数据来源
论文[1] I. Rabaev, B. Kurar Barakat, A. Churkin and J. El-Sana. The HHD Dataset. The 17th International Conference on Frontiers in Handwriting Recognition, pp. 228-233, 2020, DOI: 10.1109/ICFHR2020.2020.00050;论文[2] I. Rabaev, M. Litvak, S. Asulin and O.H. Tabibi. Automatic Gender Classification from Handwritten Images: a Case Study, the 19th International Conference on Computer Analysis of Images and Patterns, 2021.
适用场景
- 手写图像性别分类研究: 用于开发和测试从手写图像自动识别书写者性别的算法模型。
- 手写特征分析: 分析不同性别、年龄和教育背景人群的手写特征差异。
- 模式识别算法训练: 作为训练集、验证集和测试集,用于机器学习模型在手写识别任务中的训练和评估。
- 教育与心理学研究: 探究手写特征与书写者人口统计学特征(如年龄、教育背景)之间的关联。