数据集概述
本数据集包含验证和复现手稿中描述的锰校准模型所需的全部数据,涵盖新含锰标准品、矿物和混合物(MnO>2.9 wt.%)的参考数据库元数据,以及MnO成分数据、未归一化光谱数据、平均峰面积光谱、异常值判定结果、RMSECV数据、回归向量和测试集预测结果等,共23个文件。
文件详解
- 核心输入文件
- 文件名称:Supplement_MnO_Cal_Input_outliers_wvl.csv
- 文件格式:CSV
- 字段映射介绍:包含MnO成分(列B)、样品名称与文件名(列C、D)、元数据(列E-P,含样品类型、训练/测试集标记、异常值判定结果等)、光谱数据(列Q-IBX),首行后为波长通道及各样品光谱强度数据
- 交叉验证结果文件
- 文件名称:CV*.csv(共21个,如CVpredict_10-max Ridge.csv、CVpredict_BRR.csv等)
- 文件格式:CSV
- 字段映射介绍:包含各技术的交叉验证均方根误差(RMSECV)数据
- 交叉验证汇总文件
- 文件名称:Supplement_CV_summary_results.xlsx
- 文件格式:XLSX
- 字段映射介绍:列出各交叉验证运行的最小值,标记RMSECV最低的技术(绿色高亮),用于构建手稿表1
- 模型平均峰面积文件
- 文件名称:Supplement_Model_Means.csv
- 文件格式:CSV
- 字段映射介绍:包含模型的平均峰面积光谱,用于从归一化光谱生成测试模型的峰面积光谱
- 测试集预测文件
- 文件名称:Supplement_Test_Set_Predictions.csv
- 文件格式:CSV
- 字段映射介绍:包含全模型、子模型和混合模型的测试集预测结果,用于双重混合模型
- 模型回归向量文件
- 文件名称:Supplement_Model_Regression_Vectors.csv
- 文件格式:CSV
- 字段映射介绍:包含双重混合模型所用子模型的回归向量
适用场景
- 行星光谱分析模型验证: 验证和复现ChemCam火星与实验室光谱的锰定量多元模型性能
- 含锰样品光谱特征研究: 分析新含锰标准品、矿物和混合物(MnO>2.9 wt.%)的光谱数据与成分关联
- 交叉验证方法对比: 基于RMSECV数据比较不同回归技术(如Ridge、BRR、PLS等)的模型精度
- 火星探测数据解读: 支持ChemCam火星探测任务中锰元素定量分析结果的验证与应用