用于金融信号建模的匿名特征训练数据-Numerai平台
数据来源:互联网公开数据
标签:加密特征, 股票信号, 机器学习预测, 数字化金融, 数字信号处理, 二分类问题
数据集简介:
本数据集来自 Numerai 数据科学竞赛平台,用于第52轮建模任务。数据集的核心目标是通过21个加密特征预测一个布尔型目标变量(0或1),用于生成可交易的金融信号。所有特征已被加密并标准化至 [0, 1] 区间,原始语义对参赛者不可见,模型预测结果将由平台在后台解密用于实际市场中的策略评估。
字段定义:
id:每条记录的唯一标识符,用于结果文件关联
feature_1 ~ feature_21:共21个加密特征,数值范围均在 0 到 1 之间
target:目标变量,为布尔值(0 或 1),仅在训练数据中提供
prediction(提交结果中):模型预测概率值,表示该行样本为1的概率(0到1之间的浮点数)
数据特征:
数据来源:Numerai 官方发布的比赛数据集
特征类型:完全匿名加密连续变量(无语义)
目标类型:二分类(适合logloss损失函数优化)
数据格式:CSV文件(包含训练数据、验证数据和预测提交模板)
使用要求:参赛者需提交包含“id”和“prediction”列的结果文件
适用场景:
二分类模型训练(如逻辑回归、随机森林、神经网络、梯度提升树等)
模型概率输出调优(适用于 log loss 优化)
模型集成与稳定性评估(通过匿名特征提升泛化能力)
量化金融策略实验平台建模练习