金融欺诈风险评估数据集

标题:金融欺诈风险评估数据集

数据内容:该数据集包含多种与金融欺诈风险评估相关的数据元素,包括但不限于以下字段:欺诈标记(fraud_bool)、收入水平(income)、姓名与邮箱相似度(name_email_similarity)、地址变更记录(prev_address_months_count, current_address_months_count)、客户年龄(customer_age)、请求时间戳(days_since_request)、授信额度申请(intended_balcon_amount)、支付类型(payment_type)、区域编码(zip_count_4w)、行为速率分析(velocity_6h, velocity_24h, velocity_4w)、银行分支机构分布(bank_branch_count_8w)、邮箱活跃度(date_of_birth_distinct_emails_4w)、就业状态(employment_status)、信用评分(credit_risk_score)、邮箱类型(email_is_free)、居住状态(housing_status)、电话验证(phone_home_valid, phone_mobile_valid)、账户时长(bank_months_count)、多卡持有情况(has_other_cards)、信用额度建议(proposed_credit_limit)、跨境请求标记(foreign_request)、数据来源(source)、会话时长(session_length_in_minutes)、设备操作系统(device_os)、会话存活时间(keep_alive_session)、设备与邮箱关联度(device_distinct_emails_8w)、设备欺诈记录(device_fraud_count)、时间窗口(month)、匿名特征(x1, x2)。

数据来源:互联网公开数据

数据用途:该数据集可应用于多个行业和场景,主要用途包括: 1. 金融服务行业:用于欺诈检测、信用评分、风险评估、客户画像绘制、多渠道行为分析。 2. 零售与电子商务行业:用于用户身份验证、异常行为识别、交易安全监控、营销策略优化。 3. 保险行业:用于投保人风险评估、理赔欺诈识别、客户信用评估。 4. 政府与监管机构:用于金融监管、非法交易监测、反洗钱分析。

标签:金融欺诈, 风险评估, 信用评分, 行为分析, 设备特征, 区域分布, 时间序列, 多模态数据, 异常检测, 机器学习, 数据挖掘

行业分类:金融服务, 零售与电子商务, 保险, 政府与监管, 科技与互联网

统计分析:该数据集具有以下显著特点: 1. 数据维度丰富:包含客户行为、设备特征、地理分布、时间序列等多个维度的特征。 2. 数据分布合理:欺诈标记、收入水平、就业状态等关键字段具有清晰的分布特征,便于建立分类模型。 3. 高基数字段:设备指纹(device_distinct_emails_8w)、时间戳(days_since_request)等字段具有极高的基数,反映了数据的多样化特征。 4. 低基数字段:欺诈标记(fraud_bool)、数据来源(source)等字段仅有少数几种可能值,便于进行类别划分和对比分析。 5. 异常检测潜力:行为速率分析(velocity系列字段)、地址变更记录(prev_address_months_count, current_address_months_count)等字段为异常行为检测提供了丰富的特征支持。

数据与资源

附加信息

字段
版本 1
最后更新 四月 25, 2025, 10:31 (UTC)
创建于 四月 24, 2025, 02:31 (UTC)