化学分子图像InChI编码预测数据集

化学分子图像InChI编码预测数据集_Chemical_Molecular_Image_InChI_Encoding_Prediction

数据来源:互联网公开数据

标签:化学分子, 图像识别, InChI编码, 分子结构, 深度学习, 图像分割, 预测模型, 数据集

数据概述: 该数据集包含化学分子图像及其对应的InChI编码数据,旨在用于化学分子图像的InChI编码预测任务。主要特征如下: 时间跨度:数据未明确标注具体时间,可视为静态数据集。 地理范围:数据来源未明确,但InChI编码是化学物质的国际通用标识,数据具有全球通用性。 数据维度:数据集包含图像ID(image_id)和InChI编码(InChI)两类核心数据,以及训练集和测试集的图像元数据,如宽度、高度、方向和缩放比例等。此外,还包括图像的patch信息和fold划分信息。 数据格式:主要为CSV、pickle和pth格式。CSV文件存储结构化数据,如提交结果、图像元数据、patch信息等;pickle文件可能包含训练集的数据;pth文件很可能是预训练好的模型参数。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于化学信息学、计算机视觉、深度学习等领域的研究,例如分子结构识别、图像到文本的转换、化合物性质预测等。 行业应用:可为药物研发、材料科学、化学工程等行业提供数据支持,例如分子结构数据库构建、化合物筛选、新材料设计等。 决策支持:支持化学领域的决策制定,如化合物的快速检索、结构相似性分析、性质预测等。 教育和培训:作为化学、计算机科学等相关专业课程的辅助材料,帮助学生和研究人员深入理解化学分子结构与图像识别的结合。 此数据集特别适合用于探索化学分子图像与InChI编码之间的映射关系,帮助用户构建和优化预测模型,实现对化学分子结构的自动识别和编码。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 665.5 MiB
最后更新 2026年2月19日
创建于 2026年2月19日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。