信用卡欺诈检测合成数据集2010至2024-smmmmmmmmmmmm
数据来源:互联网公开数据
标签:信用卡欺诈,数据合成,Faker,交易记录,金融安全,数据分析,机器学习
数据概述:
本数据集是一个使用Python的Faker库生成的合成信用卡欺诈检测数据集,包含3000行和15列,所有字段均为数值型数据。每一行代表一次信用卡交易,列包含交易金额、信用卡号码、商户ID、交易日期和时间等属性,以及一个标识交易是否为欺诈的二进制标志。
数据用途概述:
该数据集适用于信用卡欺诈检测的研究、教学、模型训练和验证等多种场景。研究人员可以利用此数据集开发和评估欺诈检测算法;教育者可以将其用于教学案例和实验;金融机构可以利用数据集进行风险评估和策略优化。此外,数据集也适合用于数据科学和机器学习领域的基础训练和项目开发。
字段定义:
- 交易金额:交易的金额。
- 信用卡号码:用于交易的16位信用卡号码。
- 商户ID:交易发生的商户的识别编号。
- 交易月份:交易发生的月份(1-12)。
- 交易年份:交易发生的年份(2010-2024)。
- 交易日期:交易发生的日期(1-30)。
- 交易小时:交易发生的小时(0-23)。
- 交易分钟:交易发生的分钟(0-59)。
- 交易秒:交易发生的秒(0-59)。
- 欺诈标志:标识交易是否为欺诈的二进制标志,1表示欺诈交易,0表示正常交易。