金融交易欺诈检测数据集-anuai23
数据来源:互联网公开数据
标签:欺诈检测,金融交易,风险管理,机器学习,交易数据,异常检测,时间序列,欺诈行为
数据概述:
本数据集包含了一家金融公司模拟交易的详细记录,旨在用于欺诈检测模型的开发与研究。 数据集共包含6362620条交易记录,每条记录有11个字段,涵盖了交易的时间、类型、金额、发起方、接收方以及账户余额等关键信息。 数据模拟了30天内的交易活动,每一步代表一个小时的时间单位。 其中,isFraud字段标识了模拟交易中存在的欺诈行为,isFlaggedFraud字段用于标记超过特定金额(200,000)的潜在欺诈交易。
数据字典:
step:模拟时间单位,1步代表1小时,总共744步(30天)。
type:交易类型,包括CASH-IN(现金存入)、CASH-OUT(现金支出)、DEBIT(借记)、PAYMENT(支付)和TRANSFER(转账)。
amount:交易金额,以当地货币为单位。
nameOrig:发起交易的客户。
oldbalanceOrg:交易前发起方的账户余额。
newbalanceOrig:交易后发起方的账户余额。
nameDest:接收交易的客户。
oldbalanceDest:交易前接收方的账户余额。请注意,对于以“M”开头的客户(商家),没有此信息。
newbalanceDest:交易后接收方的账户余额。请注意,对于以“M”开头的客户(商家),没有此信息。
isFraud:该字段标识了模拟中欺诈代理进行的交易。在此数据集中,欺诈行为旨在通过控制客户账户并试图通过转账到另一个账户然后从系统中提取现金来获利。
isFlaggedFraud:该字段用于标记公司业务模型中试图控制从一个账户到另一个账户的大额转账并标记非法尝试的交易。在本数据集中,非法尝试是指单笔交易中转账超过200,000的尝试。
数据用途概述:
该数据集主要用于开发和评估欺诈检测模型。研究人员可以使用该数据构建机器学习模型,以预测潜在的欺诈交易,并识别与欺诈行为相关的关键特征。 此外,该数据集可用于风险管理策略的制定、欺诈预防措施的优化以及金融交易系统安全性的提升。 也可以用于学术研究、教学演示和竞赛等场景,以促进对金融欺诈行为的理解和相关技术的学习。