葡萄牙银行营销客户数据分析集-2008至2010年-mohammadnaserian
数据来源:互联网公开数据
标签:银行营销,客户数据,直接营销,电话营销,葡萄牙,数据挖掘,金融,市场分析,CRISP-DM
数据概述:
本数据集包含了葡萄牙某家银行在2008年至2010年间进行的直接营销活动的客户数据。营销活动主要通过电话进行,有时需要多次联系客户以了解其是否会对银行定期存款产品感兴趣。数据集分为两个文件:bank-full.csv 包含所有样本,按日期排序(从2008年5月到2010年11月);bank.csv 包含从bank-full.csv中随机选取的10%样本(4521条记录),用于测试计算需求较高的机器学习算法(如支持向量机SVM)。分类目标是预测客户是否订阅定期存款(变量y)。
数据用途概述:
该数据集适用于银行市场营销分析、客户行为预测、机器学习模型开发和评估等多个场景。研究者可以利用此数据集进行客户偏好分析、营销策略优化、市场趋势预测等工作;银行可以据此改进其营销策略,提高客户转化率;学术机构亦可将其作为教学和科研的宝贵资源。
数据集包含45211条记录(bank-full.csv)和4521条记录(bank.csv),共16个输入变量和1个输出变量。输入变量包括客户基本信息(如年龄、职业、婚姻状况、教育背景等),与当前营销活动相关的最后联系信息(如联系方式、联系日期、通话时长等),以及其他相关属性(如营销活动次数、上次联系间隔等)。输出变量为客户的订阅意向(是否订阅定期存款)。
字段定义:
1. age - 年龄(数值型)
2. job - 职业类型(类别型:行政人员、未知、失业、管理人员、家庭主妇、企业家、学生、蓝领工人、自营职业、退休人员、技术员、服务业)
3. marital - 婚姻状况(类别型:已婚、离婚/丧偶、单身)
4. education - 教育水平(类别型:未知、高中、初中、大学)
5. default - 是否有信用违约记录(二值型:是、否)
6. balance - 年平均余额(数值型,单位:欧元)
7. housing - 是否有住房贷款(二值型:是、否)
8. loan - 是否有个人贷款(二值型:是、否)
9. contact - 联系方式(类别型:未知、电话、手机)
10. day - 最近一次联系的日期(数值型,月份中的某一天)
11. month - 最近一次联系的月份(类别型:一月、二月、三月、……、十一月、十二月)
12. duration - 最近一次联系时长(数值型,单位:秒)
13. campaign - 本次营销活动中与该客户联系的次数(数值型,包括最近一次联系)
14. pdays - 自上次营销活动以来与客户联系的天数(数值型,-1表示从未联系过)
15. previous - 本次营销活动前与该客户联系的次数(数值型)
16. poutcome - 上次营销活动的结果(类别型:未知、其他、失败、成功)
17. y - 是否订阅定期存款(二值型:是、否)
引用请求:
如需使用本数据集,请引用如下文献:
[Moro et al., 2011] S. Moro, R. Laureano 和 P. Cortez. 使用数据挖掘进行银行直销营销:CRISP-DM方法的应用.
在 P. Novais 等(编), 欧洲仿真与建模会议 - ESM'2011 论文集, pp. 117-121, 吉马良斯, 葡萄牙, 2011年10月. EUROSIS.
获取地址:[pdf] http://hdl.handle.net/1822/14838
[bib] http://www3.dsi.uminho.pt/pcortez/bib/2011-esm-1.txt