EnzymeMap_v2_brenda2023_酶促反应数据_生物化学_机器学习数据

关注者: 0

资源积分: 30

分类

公开数据

公开数据

授权

没有提供授权

数据集

EnzymeMap_v2_brenda2023_酶促反应数据_生物化学_机器学习数据

数据集概述

本数据集包含按EC编号分类的原子映射、平衡酶促反应数据，以及用于训练IBM RXN-for-Chemistry平台Transformer模型的原始未映射数据。数据来源于BRENDA 2023-1版本，经提取、修正和整理，适用于机器学习模型预测酶促反应或生物逆合成。数据集包含3个文件，以压缩格式和JSON格式存储。

文件详解

酶促反应数据文件
文件名称：enzymemap_v2_brenda2023.csv.gz
文件格式：CSV.GZ
字段映射介绍：按EC编号分类的原子映射、平衡酶促反应数据，包含酶促反应的结构化信息，可能包括反应式、EC编号、原子映射信息等。
原始未映射数据文件
文件名称：raw_unmapped_v2_brenda2023.csv.gz
文件格式：CSV.GZ
字段映射介绍：原始未映射、未整理的数据，用于IBM RXN-for-Chemistry平台Transformer模型的重新训练。
化合物与SMILES映射文件
文件名称：compound_to_smiles.json
文件格式：JSON
字段映射介绍：化合物与SMILES（简化分子线性输入规范）的映射关系，可能用于化合物结构的表示和处理。

数据来源

BRENDA version 2023-1

适用场景

酶促反应预测模型训练: 用于训练机器学习模型，预测酶促反应或生物逆合成路径。
生物化学研究: 分析酶促反应的原子映射和平衡特性，支持生物化学领域的研究。
药物发现: 利用酶促反应数据，辅助药物分子的设计和优化。
生物信息学工具开发: 为生物信息学工具提供结构化的酶促反应数据支持。
酶分类研究: 基于EC编号分类的酶促反应数据，用于酶的分类和功能研究。

数据与资源

8254726.zipZIP
29.76 MiB

下载

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	29.76 MiB
最后更新	2026年1月18日
创建于	2026年1月18日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

智能助手

您好！我是海数据平台的智能助手，有什么可以帮助您的吗？