SMiCRM_Based_化学反应机理分子图像识别基准数据集

数据集概述

本数据集为SMiCRM(Structural molecular identifier of Molecular images in Chemical Reaction Mechanisms),是用于化学分子图像识别(OCSR)的基准数据集。包含453张有机化学反应机理图,每张图标注了分子结构的SMILES表达式和电子流动箭头,用于测试OCSR方法对含箭头注释分子图像的识别能力。

文件详解

  • mechanism.csv
  • 文件格式:CSV
  • 字段映射介绍:包含两列,file_path为图像文件路径,SMILES为对应分子结构的SMILES表达式
  • mechanism.zip
  • 文件格式:ZIP
  • 内容说明:化学反应机理图像压缩包
  • mechanism_SD.zip
  • 文件格式:ZIP
  • 内容说明:化学反应机理相关的结构化数据压缩包

适用场景

  • 化学分子图像识别(OCSR)技术评估: 测试OCSR工具对含箭头注释的化学反应机理图的识别精度
  • 有机化学反应机理分析: 通过标注的SMILES和箭头信息,辅助分析电子流动路径和反应机制
  • 化学信息学模型训练: 用于训练能处理复杂分子图像的机器学习模型
  • 化学教育资源开发: 作为可视化教学材料,帮助理解有机化学反应的电子转移过程
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 8.39 MiB
最后更新 2026年1月29日
创建于 2026年1月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。