信用卡欺诈检测FAIR实践数据集

数据集概述

本数据集是信用卡欺诈检测的FAIR合规实践项目资料,包含训练/验证/测试数据拆分、训练好的随机森林模型、评估输出及模型卡片,还有带文档的代码文件,支持可复现的欺诈检测研究与应用。

文件详解

  • 数据文件:
  • training_subset.csv:CSV格式,训练子集数据,字段包括交易编号、商户ID、日平均交易金额、交易金额、是否拒绝等
  • validation_subset.csv:CSV格式,验证子集数据,字段与训练子集一致
  • test_subset.csv:CSV格式,测试子集数据,字段与训练子集一致
  • credit_card.csv:CSV格式,可能为完整或原始数据文件
  • 代码与环境文件:
  • Task (1).ipynb:Jupyter Notebook格式,包含端到端欺诈检测代码
  • requirements.txt:TXT格式,列出依赖库,如pandas、scikit-learn等
  • codemeta.json:JSON格式,代码元数据文件,包含上下文、类型、名称等字段
  • 文档与许可证文件:
  • README.md:MD格式,项目说明文档,包含运行指南
  • Add MIT license.txt:TXT格式,MIT许可证文件
  • DMP_Credit Card Fraud Detection.pdf:PDF格式,数据管理计划文档

适用场景

  • 金融风控研究:用于信用卡欺诈检测模型的训练与验证
  • 机器学习实践:学习FAIR合规的端到端模型开发流程
  • 模型评估分析:基于混淆矩阵、ROC曲线等评估输出优化欺诈检测模型
  • 数据管理研究:参考FAIR原则的数据与模型管理实践案例
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.91 MiB
最后更新 2025年12月6日
创建于 2025年12月6日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。