德国手语数据集
数据来源:互联网公开数据
标签:德国手语,手语识别,神经网络,机器学习,实时检测,教育应用,伦理考虑
数据概述:
本数据集旨在训练一个用于实时手语检测的神经网络,该神经网络将作为学习应用程序中的自动化反馈工具。数据集基于MediaPipe手部姿势解决方案提供的标准化手部关键点向量,以确保训练的神经网络对光照条件或肤色的变化具有不变性,这些因素在数据集中难以充分多样化表示。
数据集设计用于训练一个能够对MediaPipe手部姿势解决方案输出的MULTI_HAND_LANDMARK进行分类的神经网络。
数据集包含64列,其中第一列是样本标签。所有静态手语(不涉及运动的手语)字母表中的24个类别('a'-'y',排除'j')被表示为24个类别。
其余列代表MediaPipe手部姿势解决方案提供的21个线性化三维手部关键点的标准化([0.0, 1.0]范围)状态。
数据集中总共包含约7300个样本,每个类别至少有250个样本,由7位不同的非母语手语者录制。
该数据集仅由录制样本组成,未使用数据增强技术。
数据用途概述:
该数据集适用于手语识别的多种实际应用场景,包括但不限于实时手语检测、手语学习应用程序中的自动化反馈、手语翻译系统等。此外,数据集也适合用于研究和教育领域,帮助开发人员和学习者理解手语识别技术的潜力及其社会影响。
伦理考虑:
我们意识到此类数据集的伦理问题,并鼓励开发人员认真考虑机器学习和手语识别伦理的相关研究,以避免良好意图项目可能带来的负面影响。我们推荐Briggs, D., Caselli, N., Hochgesang, J. A., Huenerfauth, M., Katz-Hernandez, L., Koller, O., Kushalnagar, R., Vogler, C., & Ladner, R. E. (2021). The FATE Landscape of Sign Language AI Datasets: An Interdisciplinary Perspective. In ACM Transactions on Accessible Computing (14th ed., Vol. 2, pp. 1-45). Association for Computing Machinery. 10.1145/3436996作为相关研究的起点。