机器学习黑客松产品实体预测数据集1963-2021

机器学习黑客松产品实体预测数据集1963-2021 数据来源:互联网公开数据 标签:机器学习,黑客松,产品预测,图像识别,实体识别,数据标注 数据概述: 本数据集包含用于机器学习黑客松的产品实体预测任务所需的数据。数据集分为训练集和测试集,其中训练集包含产品图像的链接、产品类别代码、实体名称和实体值等信息,测试集则缺少实体值字段,需要参赛者通过模型预测。 数据用途概述: 该数据集适用于产品实体预测、图像识别和实体识别等机器学习任务。参赛者可以利用训练集数据训练模型,并使用测试集数据进行预测。预测结果需按照指定格式输出,参赛者可以通过参加黑客松比赛来展示其模型的预测性能。 数据集包含以下字段: - index: 数据样本的唯一标识符(ID) - image_link: 产品图像的公开URL,可以通过src/utils.py中的download_images函数下载。示例链接:https://m.media-amazon.com/images/I/71XfHPR36-L.jpg - group_id: 产品类别代码 - entity_name: 产品实体名称。例如:“item_weight” - entity_value: 产品实体值。例如:“34 gram” 注意:对于test.csv文件,您将不会看到entity_value列,因为这是目标变量。 输出格式: 输出文件应为包含两列的CSV文件: - index: 数据样本的唯一标识符(ID)。请注意,索引应与测试记录的索引匹配。 - prediction: 一个字符串,应具备以下格式:“x unit”,其中x是一个标准格式的浮点数,unit是允许的单位之一(允许的单位在附录中列出)。两个值之间应有一个空格。例如:“2 gram”、“12.5 centimetre”、“2.56 ounce”为有效格式。以下为无效格式示例:“2 gms”、“60 ounce/1.7 kilogram”、“2.2e2 kilogram”等。 注意:务必为所有索引输出预测结果。如果任何测试样本的图像中未找到值,请返回空字符串,即“”。如果输出文件中的输出样本数量与test.csv中的数量不匹配,您的输出将不会被评估。 数据集文件: - train.csv: 包含标签(entity_value)的训练文件。 - test.csv: 不含输出标签(entity_value)的测试文件。请使用您的模型/解决方案生成此文件中数据的预测结果,并将输出文件格式与sample_test_out.csv匹配(请参见上述“输出格式”部分)。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 5.74 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。