葡萄牙银行电话营销客户购买定期存款数据集-2008-2010
数据来源:互联网公开数据
标签:银行营销,客户行为,定期存款,电话营销,预测模型,机器学习,金融,市场营销
数据概述:
本数据集包含葡萄牙一家银行的电话营销活动的相关数据,记录了2008年5月至2010年11月期间的营销活动。数据集旨在预测客户是否会购买银行的定期存款产品。数据来源于银行的电话营销活动,其中包含了客户的基本信息、与客户的最后一次联系的详细信息、以及社会经济背景等多个方面。数据集提供了两种版本,分别包含所有样本(约41000条记录)和部分样本(约4000条记录),以适应不同计算需求的分析。
数据包含以下字段:
客户数据:
年龄(数值型)
职业(类别型:'admin.', 'blue-collar', 'entrepreneur', 'housemaid', 'management', 'retired', 'self-employed', 'services', 'student', 'technician', 'unemployed', 'unknown')
婚姻状况(类别型:'divorced', 'married', 'single', 'unknown','divorced'包含离婚或丧偶)
教育程度(类别型:'basic.4y', 'basic.6y', 'basic.9y', 'high.school', 'illiterate', 'professional.course', 'university.degree', 'unknown')
是否有违约信用(类别型:'no', 'yes', 'unknown')
是否有住房贷款(类别型:'no', 'yes', 'unknown')
是否有个人贷款(类别型:'no', 'yes', 'unknown')
与当前营销活动最后一次联系相关:
联系方式(类别型:'cellular', 'telephone')
月份(类别型:'jan', 'feb', 'mar', …, 'nov', 'dec')
星期几(类别型:'mon', 'tue', 'wed', 'thu', 'fri')
联系时长(秒,数值型)。重要提示:此属性对输出目标有很大影响(例如,如果duration=0,则y='no')。但是,在进行呼叫之前,duration是未知的。此外,在通话结束后,显然已知y。因此,此输入仅应用于基准测试,如果目的是建立一个现实的预测模型,则应将其丢弃。
其他属性:
活动次数:在本次活动中,针对该客户进行的联系次数(数值型,包括最后一次联系)
pdays:在上次活动中联系客户后经过的天数(数值型;999表示客户之前未被联系)
previous:在本次活动之前,针对该客户进行的联系次数(数值型)
poutcome:上次营销活动的结果(类别型:'failure', 'nonexistent', 'success')
社会和经济背景属性:
emp.var.rate:就业变动率 - 季度指标(数值型)
cons.price.idx:消费者物价指数 - 月度指标(数值型)
cons.conf.idx:消费者信心指数 - 月度指标(数值型)
euribor3m:3个月期欧洲银行间同业拆借利率 - 每日指标(数值型)
nr.employed:雇员人数 - 季度指标(数值型)
输出变量(目标):
y:客户是否购买了定期存款?(二元:'yes', 'no')
数据用途概述:
该数据集适用于客户购买行为预测、市场营销活动效果评估、银行客户细分等多种应用场景。研究人员可以利用此数据构建预测模型,预测客户是否会购买定期存款,从而优化营销策略。此外,数据集还可以用于分析不同客户群体对产品的接受程度,帮助银行制定更具针对性的营销方案。 数据集也适用于机器学习模型的训练和测试,例如分类算法,用于预测客户购买行为。