数据集

亚马逊机器学习挑战2024产品图像实体信息提取数据集-babykrishnaml

亚马逊机器学习挑战2024产品图像实体信息提取数据集-babykrishnaml 数据来源：互联网公开数据标签：亚马逊,机器学习,挑战,产品图像,实体提取,e-commerce,健康,内容审核,图像识别,产品信息

数据概述：本数据集是亚马逊机器学习挑战2024的一部分，旨在构建一个能够从产品图像中提取实体值的机器学习模型。这一任务在电子商务、医疗保健和内容审核等领域至关重要，因为这些领域需要精确的产品信息（如重量、体积、电压、尺寸等），但这些信息并不总是以文本形式提供。

数据集包含以下字段： - index：每个样本的唯一标识符（ID）。 - image_link：产品图像的公共URL。这些图像需要使用辅助函数进行下载。 - group_id：表示产品组别的类别代码。 - entity_name：产品所代表的信息类型（如item_weight, dimensions）。 - entity_value：与产品实体相关的实际值（如34 gram）。注意：此字段仅在训练集中可用。测试集中不包含entity_value，因为这是目标变量。

数据用途概述：该数据集适用于机器学习模型的训练和测试，特别适合用于产品图像中的实体信息提取任务。研究人员和数据科学家可以利用此数据集开发算法，以自动从产品图像中提取关键信息。此外，该数据集还适用于教育和培训场景，帮助学习者掌握图像识别和机器学习的相关技术。

数据与资源

versions_20250411013825.zipZIP
4.93 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	4.93 MiB
最后更新	2025年4月21日
创建于	2025年4月21日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

亚马逊机器学习挑战2024产品图像实体信息提取数据集-babykrishnaml

数据与资源

附加信息

注册成功！