金融欺诈风险评估数据集FinancialFraudRiskAssessment-husanrahmatullayev
数据来源:互联网公开数据
标签:欺诈检测, 风险评估, 信用风险, 机器学习, 金融科技, 数据挖掘, 欺诈行为, 行为分析
数据概述:
该数据集包含用于金融欺诈风险评估的交易数据,记录了用户的多种行为特征,用于识别潜在的欺诈交易。主要特征如下:
时间跨度:数据未明确标明时间范围,但根据特征字段(如“month”)推测可能包含一段时间内的交易记录。
地理范围:未明确地理范围信息,但数据涵盖了多种用户行为和交易属性,具有一定的通用性。
数据维度:数据集包含31个特征,包括:fraud_bool(欺诈标识,1表示欺诈,0表示正常),income(收入),name_email_similarity(姓名与邮箱相似度),prev_address_months_count(前居住地址月数),current_address_months_count(当前居住地址月数),customer_age(客户年龄),days_since_request(距离请求天数),intended_balcon_amount(预期余额),payment_type(支付类型),zip_count_4w(4周内邮编计数),velocity_6h(6小时内交易速度),velocity_24h(24小时内交易速度),velocity_4w(4周内交易速度),bank_branch_count_8w(8周内银行分支机构计数),date_of_birth_distinct_emails_4w(4周内不同出生日期邮箱计数),employment_status(就业状态),credit_risk_score(信用风险评分),email_is_free(邮箱是否免费),housing_status(居住状态),phone_home_valid(家庭电话是否有效),phone_mobile_valid(手机是否有效),bank_months_count(银行账户月数),has_other_cards(是否有其他信用卡),proposed_credit_limit(提议信用额度),foreign_request(是否为国外请求),source(来源),session_length_in_minutes(会话时长),device_os(设备操作系统),keep_alive_session(会话保持),device_distinct_emails_8w(8周内设备不同邮箱计数),device_fraud_count(设备欺诈计数),month(月份)。
数据格式:CSV格式,文件名为Base.csv,易于数据分析和建模处理。
该数据集适合用于构建欺诈检测模型、分析用户行为模式和评估信用风险。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于金融风险管理、机器学习与欺诈检测交叉领域的学术研究,如异常检测、欺诈行为模式分析等。
行业应用:为金融机构、支付平台、电商平台等提供数据支持,尤其适用于构建欺诈检测系统、信用风险评估模型,提升风控效率。
决策支持:支持金融机构的风险管理决策,例如优化风控策略、调整信用额度、识别高风险用户。
教育和培训:作为数据科学、机器学习、金融风控等相关课程的实训材料,帮助学生和研究人员深入理解欺诈检测的原理和技术。
此数据集特别适合用于探索欺诈交易的规律与特征,帮助用户构建有效的欺诈检测模型,提高识别欺诈行为的准确率。