亚马逊机器学习挑战2024产品图像实体信息提取数据集-babykrishnaml

亚马逊机器学习挑战2024产品图像实体信息提取数据集-babykrishnaml 数据来源:互联网公开数据 标签:亚马逊,机器学习,挑战,产品图像,实体提取,e-commerce,健康,内容审核,图像识别,产品信息

数据概述: 本数据集是亚马逊机器学习挑战2024的一部分,旨在构建一个能够从产品图像中提取实体值的机器学习模型。这一任务在电子商务、医疗保健和内容审核等领域至关重要,因为这些领域需要精确的产品信息(如重量、体积、电压、尺寸等),但这些信息并不总是以文本形式提供。

数据集包含以下字段: - index:每个样本的唯一标识符(ID)。 - image_link:产品图像的公共URL。这些图像需要使用辅助函数进行下载。 - group_id:表示产品组别的类别代码。 - entity_name:产品所代表的信息类型(如item_weight, dimensions)。 - entity_value:与产品实体相关的实际值(如34 gram)。注意:此字段仅在训练集中可用。测试集中不包含entity_value,因为这是目标变量。

数据用途概述: 该数据集适用于机器学习模型的训练和测试,特别适合用于产品图像中的实体信息提取任务。研究人员和数据科学家可以利用此数据集开发算法,以自动从产品图像中提取关键信息。此外,该数据集还适用于教育和培训场景,帮助学习者掌握图像识别和机器学习的相关技术。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 4.93 MiB
最后更新 2025年4月21日
创建于 2025年4月21日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。