数据集概述
本数据集包含Steep Hill Inc.测试的17600个大麻品种的化学型数据,涉及多种大麻素(如CBD、THC相关物质)和萜烯的浓度记录。数据通过机器学习技术用于插值缺失观测值和基于化学型相似性聚类品种,为大麻素生物合成调控及品种表型分类研究提供支持。
文件详解
- 数据文件(CSV格式)
- 文件名称:t_c-2018-06-26.csv、LIMS_Data_dump_2017-07-06.csv、OAK.csv、flower_export.csv、HT_HPLC_6-13-2016.csv、DEN.csv、LIMS_database_dump_2017-05-05.csv等(共9个)
- 文件格式:CSV
- 字段映射介绍:包含样本ID、品种名称、检测日期、实验室ID、大麻素(CBC、CBD、CBDA、CBN等)浓度、萜烯(3-Carene、Aromadendrene等)浓度、报告ID、检测地点、仪器信息等字段
- 数据文件(XLSX格式)
- 文件名称:berkeley_terps_and_cannabinoids_all_columns_no_negatives.xlsx、SEA.xlsx、hplcresults_jeremy_01_2015-11-09.xlsx、Halent_Data_From_Travis.xlsx等(共5个)
- 文件格式:XLSX
- 字段映射介绍:包含大麻素和萜烯的完整浓度数据,部分文件覆盖所有检测列且无负值记录
数据来源
论文“Modeling cannabinoids from a large-scale sample of Cannabis sativa chemotypes”
适用场景
- 大麻素生物合成研究: 分析不同品种大麻素浓度分布,探究生物合成调控机制
- 大麻品种分类: 基于化学型相似性聚类品种,优化表型分类体系
- 药理学研究: 挖掘大麻素浓度与药理活性的关联,支持药物研发
- 农业育种应用: 为大麻品种选育提供化学型数据支撑,定向培育高价值品种
- 监管合规分析: 辅助医疗及娱乐用大麻的成分检测与合规性验证