美国共同基金数据集

美国共同基金数据集 数据来源:互联网公开数据 标签:共同基金,美国,投资分析,预测模型,基点利差,金融数据,回归分析 数据概述: 本数据集包含美国共同基金的相关信息,旨在预测每只基金相对于AAA级债券的基点利差(即“bonds_aaa”特征)。数据集分为训练集(train.csv)和测试集(test.csv),其中训练集包含9518个实例及153个特征(包括目标特征),测试集包含2380个实例及152个特征(不包括目标特征)。此外,还提供了一个数据字典文件(MutualFundReturnsDataDictionary.csv),用于解释每个特征的含义。 数据用途概述: 该数据集适用于共同基金投资分析、基点利差预测及金融建模等多种场景。研究人员和投资者可通过训练预测模型来评估共同基金相对于AAA级债券的额外收益情况。此外,数据集也适合用于教育培训,帮助学习者理解和应用线性回归、岭回归和套索回归等技术。 举例: 例如,使用者可以利用训练集数据(train.csv)训练线性回归模型,并通过网格搜索(GridsearchCV)优化模型参数。模型训练完成后,可以使用测试集数据(test.csv)进行预测,并根据预测结果生成提交文件(sample_submission.csv),以参与模型性能评估。评估指标采用均方根误差(RMSE),具体评分标准如下:RMSE小于16.5分获100%的可用分数;RMSE在16.5到20之间获80%的可用分数;RMSE在20到25之间获70%的可用分数;RMSE大于等于25则不获分数。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 1.03 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。