数据集概述
本数据集为匿名化数据,提取自法国巴黎银行个人金融(BNP PARIBAS PERSONAL FINANCE)的在线分期付款产品,包含可构建为图结构的银行欺诈数据(类别不平衡),用于机器学习模型的训练与验证。
文件详解
- 图结构文件:
- donnees_sommets.csv:CSV格式,含十四列,存储图中节点编号及相关数据
- liens_sommets.csv:CSV格式,存储图中节点间的连接关系,含SOURCE(源节点)、TARGET(目标节点)字段
- 训练验证文件:
- train_cv_GNN.csv:CSV格式,用于构建训练集和交叉验证集(GNN模型)
- train_cv_ME.csv:CSV格式,用于构建训练集和交叉验证集(ME模型)
- 测试文件:
- test_GNN.csv:CSV格式,用于构建测试集(GNN模型)
- test_ME.csv:CSV格式,用于构建测试集(ME模型)
- 时间外验证文件:
- observation_perf.csv:CSV格式,含已融资的申请数据,用于对比模型与现有方法的性能
- 补充文档:
- Fichier_complémentaire.pdf:PDF格式,提供数据集的详细说明
数据来源
Facci Aurélien、Pinaud Bruno、Cavarroc Julie及Pidash Angelina的论文《Apprentissage machine appliqué à la détection de fraudes bancaires》,数据提取自BNP PARIBAS PERSONAL FINANCE的在线分期付款产品
适用场景
- 金融欺诈检测研究:分析分期付款场景下的欺诈模式
- 图神经网络应用:基于图结构数据构建欺诈检测模型
- 机器学习模型验证:用于评估不同模型在类别不平衡数据上的性能
- 金融风控优化:对比现有风控方法与新模型的效果差异