机器黑客ML商品流行度预测数据集

机器黑客ML商品流行度预测数据集 数据来源:互联网公开数据
标签:商品流行度预测,多分类分类,特征工程,机器学习,商业分析

数据概述:
本数据集来源于印度一家顶级服装品牌,包含了商品类别、评分和店内存在情况等详细信息。数据集旨在帮助品牌预测商品在特定市场中的流行程度,从而优化市场推广策略。数据集分为训练集和测试集,训练集包含18208行和12列(其中一列为目标变量“流行度”),测试集包含12140行和11列。

数据用途概述:
该数据集适用于商品流行度预测、多分类分类建模和特征工程等场景。企业可以通过分析训练数据优化商品推广策略,提升商品在不同市场的流行程度。此外,该数据集也适合用于教育培训,帮助学习者掌握多分类模型的构建与优化方法。

举例:
数据集中的字段包括store_ratio(店铺比率)、basket_ratio(购物篮比率)、category_1(类别1)、store_score(店铺评分)、category_2(类别2)、store_presence(店铺存在情况)、score_1至score_4(不同评分)、time(时间)、popularity(流行度,目标变量)。参赛者需要根据这些特征预测商品的流行度等级。
参赛者需使用多分类分类模型,并通过高级特征工程优化模型性能,最终以多分类对数损失(Multi-Class log loss)作为评价指标。提交结果时,需生成一个包含12140行和5列(分别为0, 1, 2, 3, 4五个流行度等级概率)的csv或xlsx文件。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.98 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。