数据集概述
本数据集包含2025年1月18日至23日在ibm_brisbane设备上运行的量子机器学习(QML)模型输出样本,用于OSCD数据集的像素级变化检测。数据涵盖未训练模型在模拟器与真实设备的输出对比、训练模型模拟器输出等核心内容,以及辅助文件、处理脚本和修改后的库文件,总计18个文件。
文件详解
- 核心分析数据
untrained_sim_final_analysis_data.pkl/untrained_sim_final_analysis_data.hdf5:核心数据文件,存储未训练权重模型在模拟器与ibm_brisbane真实设备的聚合输出,支持模拟器与真实设备输出质量差异评估
trained_sim_final_analysis_data.pkl/trained_sim_final_analysis_data.hdf5:存储训练模型模拟器输出与未训练模型真实设备输出,用于补充分析
- 原始与辅助数据
raw.zip:压缩包,包含真实设备运行的原始备份(.txt)数据,记录模型输入、输出及样本处理时间
auxiliary_data.zip:压缩包,包含训练与未训练模型在无噪声模拟器上处理OSCD数据集测试批次的结果
- 处理脚本
brisbane_data_preparation.py:用于处理原始数据的脚本
brisbane_analysis.py:用于分析数据集的脚本
- 模型与权重文件
mc_noiseless_default.pth/refac_mc_noiseless_default.pth:模型文件,前者为数据采集所用(量子层为随机权重),后者适配最新代码版本
model_weights.pkl/model_weights.hdf5:存储模型在真实设备运行时的权重数据
- 辅助信息文件
training_curve_data.txt:记录模型训练过程中各epoch的训练/验证准确率与损失
pip_freeze.txt:记录数据采集所用Python环境的依赖包信息
computations_cost_estimation.xlsx:模型样本获取成本的粗略估算表格
transpiled_model_example.txt:模型运行示例文件(含权重设置)
- 修改后的库文件
qiskit_device.py:修改后的pennylane_qiskit.qiskit_device脚本,含禁止qiskit_session单样本后关闭的热修复
converter.py:修改后的pennylane-qiskit.converter脚本,含ECR门编译热修复(未实际使用)
数据来源
ESA合同支持的量子机器学习项目,基于IBM Quantum环境运行
适用场景
- 量子机器学习模型性能评估:对比未训练模型在模拟器与真实量子设备(ibm_brisbane)的输出差异,分析设备噪声等因素影响
- 光谱信息处理研究:基于OSCD数据集的像素级变化检测任务,验证量子神经网络在光谱信息处理中的应用潜力
- 量子模型训练分析:通过训练曲线数据研究量子模型的训练收敛性与性能变化趋势
- 量子计算成本评估:利用成本估算表格分析真实量子设备运行模型的资源消耗与成本效益
- 量子软件开发环境复现:基于依赖包信息与修改后的库文件,复现模型运行的Python环境与技术细节