数据集概述
本数据集包含图像组学工作流的原始数据与分析结果,涵盖从Fish-AIR仓库获取的鱼类图像元数据、质量信息,以及Minnow_Segmented_Traits仓库输出的采样统计、存在-缺失矩阵、热图图像等处理后数据,支持研究可重复性。
文件详解
该数据集包含13个文件,分为Fish-AIR原始数据与Minnow_Segmented_Traits工作流输出两类,具体说明如下:
- Fish-AIR原始数据文件:
- extendedImageMetadata.csv:CSV格式,含图像元数据,列包括ARKID、fileNameAsDelivered、format、createDate、metadataDate、size、width、height、license、publisher、ownerInstitutionCode
- imageQualityMetadata.csv:CSV格式,含图像质量信息,列包括ARKID、license、publisher、ownerInstitutionCode、createDate、metadataDate、specimenQuantity、containsScaleBar、containsLabel等
- multimedia.csv:CSV格式,含图像下载信息,列包括ARKID、parentARKID、accessURI、createDate、modifyDate、fileNameAsDelivered、format、scientificName等
- meta.xml:XML格式,含原始下载文件的列索引与URI元数据,用于R脚本提取列头
- Minnow_Segmented_Traits工作流输出文件:
- sampling.df.seg.csv:CSV格式,数据清洗与分析阶段的物种图像采样统计,对应Balk et al.表S1
- presence.absence.matrix.csv:CSV格式,未清洗的分割结果存在-缺失矩阵,对应Balk et al.表S3的原始版本
- heatmap.avg.blob.png:PNG格式,各性状最大斑点平均面积热图,对应Balk et al.图S3
- heatmap.sd.blob.png:PNG格式,各性状最大斑点面积标准差热图,对应Balk et al.图S3
- minnow.filtered.from.iqm.csv:CSV格式,经质量过滤后的鱼类图像数据集
- burress.minnow.sp.filtered.from.iqm.csv:CSV格式,经质量过滤并筛选Burress et al. 2017物种后的鱼类图像数据集
- sampling.minnows.95.blob.3.segments.csv:CSV格式,含Scientific_Name(科学名称)、Sample_Size(样本量)列的采样统计
- presence.absence.sample.dist.png:PNG格式,存在-缺失样本分布图像
- README.txt:TXT格式,数据集说明文档
数据来源
Fish-AIR仓库、Minnow_Segmented_Traits仓库
适用场景
- 图像组学研究:用于验证图像组学工作流的分析流程与结果
- 鱼类形态学分析:基于鱼类图像元数据与分割结果研究形态特征
- 生物多样性研究:分析特定鱼类物种(如Cyprinidae科)的图像数据分布
- 数据质量评估:利用图像质量元数据研究生物图像数据集的质量控制方法
- 可重复性研究:作为案例验证跨仓库数据整合与分析的可重复性