环形正态分布二维分类问题数据集-20维-2011至2015年-timrie
数据来源:互联网公开数据
标签:环形正态分布,分类问题,多变量正态分布,机器学习,主动学习,数据集,学术研究
数据概述:
本数据集是一个20维的二分类问题数据集,每个类别分别由一个多变量正态分布生成。类别1的均值为零,协方差矩阵为4倍单位矩阵。类别2的均值为(a, a, ..., a),其中a=2/sqrt(20),协方差矩阵为单位矩阵。该数据集适用于研究分类算法、机器学习模型的性能评估以及主动学习策略的探索。
数据用途概述:
该数据集适用于机器学习和数据挖掘领域的多种研究场景,包括分类算法的开发与评估、主动学习策略的研究、数据表示与特征选择、模型复杂度分析等。研究人员可以利用本数据集进行算法验证、模型比较和实验设计;教育工作者可以将其用于教学演示和实验教学;数据科学家可以基于此进行初步的数据探索和模型构建。此外,该数据集还适合用于评估不同主动学习方法在数据选择和分类任务中的表现,为相关领域的学术研究提供支持。
引用:
Zheng Wang 和 Jieping Ye. Querying Discriminative and Representative Samples for Batch Mode Active Learning. ACM Transactions on Knowledge Discovery from Data (TKDD), 9(3):1–23, 2015.
Bo Du, Zengmao Wang, Lefei Zhang, Liangpei Zhang, Wei Liu, Jialie Shen, 和 Dacheng Tao. Exploring Representativeness and Informativeness for Active Learning. IEEE Transactions on Cybernetics, 47(1):14–26, 2015.