面向目标营销的个性化广告效果评估数据集-2021-aminghias
数据来源:互联网公开数据
标签:营销,广告,目标营销,Uplift建模,Criteo,数据集,用户特征,效果评估,营销策略
数据概述:
本数据集灵感来源于Kaggle上的“Uplift Modeling, Marketing and Campaign Data”,由Criteo的人工智能实验室提供。数据集包含1300万条记录,每条记录提供了用户12个特征的信息,以及4个二元标签(1, 0),分别是:访问(visit)、转化(conversion)、治疗(treatment)、曝光(exposure)。其中,访问(visit)为1表示用户在测试期内(2周)访问了广告主的网站。数据集中还包含一个类别目标变量,用于标识用户所属的类别。
为了保护隐私,特征名称已被匿名化,且特征值经过随机投影处理,以保持预测能力的同时,使恢复原始特征或用户背景变得几乎不可能。
数据集中的目标变量类别包含以下四类:
-
Lost cause:这些用户无论是否接受治疗,都不会访问网站,因此被视为无救用户,不应进行任何治疗或营销干预。
-
Sure Thing:这些用户无论是否接受治疗,都会访问网站,因此被视为确定会访问的用户,不应进行额外的营销干预。
-
Do not Disturb:这些用户在接受治疗后不会访问网站,而如果不接受治疗则会访问。因此,治疗对他们有负面影响,不应进行任何营销干预。
-
Persuadable:这些用户在接受治疗后会访问网站,而如果不接受治疗则不会访问。因此,治疗对他们有正面影响,应始终进行营销干预。
以下是特征的详细描述:
f0, f1, f2, f3, f4, f5, f6, f7, f8, f9, f10, f11:特征值(密集型,浮点数)
treatment:是否接受治疗(1 = 接受治疗,0 = 对照组)
conversion:该用户是否发生了转化(二元标签)
visit:该用户是否访问了网站(二元标签)
exposure:治疗效果,该用户是否被有效暴露(二元标签)
数据用途概述:
该数据集适用于目标营销策略研究、个性化广告效果评估、Uplift建模等多种场景。研究人员和营销人员可以利用该数据集进行用户分类,识别出不同响应类型的用户群体,从而制定更加精准的营销策略。此外,数据集还可以用于教学和培训,帮助学习者理解Uplift建模的基本概念和应用方法。