用于金融信号建模的匿名特征训练数据-Numerai平台

用于金融信号建模的匿名特征训练数据-Numerai平台 数据来源:互联网公开数据
标签:加密特征, 股票信号, 机器学习预测, 数字化金融, 数字信号处理, 二分类问题

数据集简介: 本数据集来自 Numerai 数据科学竞赛平台,用于第52轮建模任务。数据集的核心目标是通过21个加密特征预测一个布尔型目标变量(0或1),用于生成可交易的金融信号。所有特征已被加密并标准化至 [0, 1] 区间,原始语义对参赛者不可见,模型预测结果将由平台在后台解密用于实际市场中的策略评估。

字段定义:

id:每条记录的唯一标识符,用于结果文件关联

feature_1 ~ feature_21:共21个加密特征,数值范围均在 0 到 1 之间

target:目标变量,为布尔值(0 或 1),仅在训练数据中提供

prediction(提交结果中):模型预测概率值,表示该行样本为1的概率(0到1之间的浮点数)

数据特征:

数据来源:Numerai 官方发布的比赛数据集

特征类型:完全匿名加密连续变量(无语义)

目标类型:二分类(适合logloss损失函数优化)

数据格式:CSV文件(包含训练数据、验证数据和预测提交模板)

使用要求:参赛者需提交包含“id”和“prediction”列的结果文件

适用场景:

二分类模型训练(如逻辑回归、随机森林、神经网络、梯度提升树等)

模型概率输出调优(适用于 log loss 优化)

模型集成与稳定性评估(通过匿名特征提升泛化能力)

量化金融策略实验平台建模练习

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 12.49 MiB
最后更新 2025年4月18日
创建于 2025年4月18日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。