菲律宾维萨延疣猪幼崽血液样本白细胞分类数据集-2022-tejaskarkera001
数据来源:互联网公开数据
标签:维萨延疣猪,血液样本,白细胞分类,生物多样性,濒危物种,菲律宾,机器学习,医学图像,健康评估,图像处理
数据概述:
本数据集包含菲律宾维萨延疣猪幼崽的血液涂片图像,旨在通过机器学习方法进行白细胞分类。维萨延疣猪是一种濒危的稀有物种,保护其健康状况对于物种存续至关重要。数据集分为5个类别,包括嗜酸性粒细胞、淋巴细胞、中性粒细胞、单核细胞和嗜碱性粒细胞,共计1407个样本,来源于经过分类裁剪的目录。数据集中存在明显的类别不平衡问题,需要对少数类进行上采样处理。
数据用途概述:
该数据集适用于多种研究和应用领域,包括濒危物种健康监测、白细胞分类模型开发、医学图像处理技术研究等。研究人员可以利用此数据集训练机器学习模型,进行白细胞分类和健康状况评估;兽医可以利用分类结果监控维萨延疣猪的健康状况,及时发现潜在疾病;教育机构可以利用此数据集进行医学图像处理和生物多样性保护的教学。
数据集信息:
- 数据集分为5个类别:嗜酸性粒细胞、淋巴细胞、中性粒细胞、单核细胞、嗜碱性粒细胞
- 总样本数为1407个
- 存在类别不平衡,需进行上采样处理
预处理步骤:
- 从图像数据集中创建一个结构化的CSV文件,便于后续使用
- 图像经过多种增强处理,包括随机垂直翻转、随机水平翻转、随机旋转、颜色抖动(亮度和对比度各0.2,色相0.2,饱和度0.5)、高斯模糊(内核大小分别为3和5,概率为0.2)、随机仿射变换(旋转角度45度,平移范围0.0625,缩放比例0.8至1.2)、随机透视变换(变形比例0.3)、归一化(通过计算数据的均值和标准差)
致谢:
数据集由Jacqueline Rose Alipo-on, Francesca Isabelle Escobar, Jemima Loise Novia, Monica Marie Atienza, Sonny Mana-ay, Myles Joshua Tan, Nouar AlDahoul, Evan Yu于2022年2月25日在IEEE Dataport上发布,数据集DOI为https://dx.doi.org/10.21227/3qsb-d447。图像由Robin Ewers Carnes提供。