音乐流派分类音频特征数据集MusicGenreClassificationAudioFeatureDataset-ahmadfakhar
数据来源:互联网公开数据
标签:音乐流派, 音频特征, 机器学习, 声音识别, 数据分析, 时域特征, 频域特征, 音乐分析
数据概述:
该数据集包含从多种音乐流派中提取的音频特征,用于音乐流派的分类任务。主要特征如下:
时间跨度:数据未明确标注时间范围,可视为静态音频特征集合。
地理范围:数据来源未明确,但涵盖了多种音乐流派,具有一定的普适性。
数据维度:数据集包含两份CSV文件,分别提取了30秒和3秒音频片段的特征。主要特征包括:
文件名称(filename):音频文件名。
时长(length):音频时长,以采样点数计。
色谱图均值和方差(chroma_stft_mean, chroma_stft_var):表示音频的音高分布。
均方根能量均值和方差(rms_mean, rms_var):表示音频的能量。
频谱质心均值和方差(spectral_centroid_mean, spectral_centroid_var):表示音频的频率重心。
频谱带宽均值和方差(spectral_bandwidth_mean, spectral_bandwidth_var):表示音频的频率分布范围。
滚降频率均值和方差(rolloff_mean, rolloff_var):表示音频的频率衰减点。
过零率均值和方差(zero_crossing_rate_mean, zero_crossing_rate_var):表示音频的过零次数。
谐波均值和方差(harmony_mean, harmony_var):表示音频的谐波成分。
感知特征均值和方差(perceptr_mean, perceptr_var):表示音频的感知特性。
节奏(tempo):音频的节奏信息。
梅尔倒谱系数均值和方差(mfcc1_mean ~ mfcc20_var):表示音频的梅尔频率倒谱系数。
标签(label):音频所属的音乐流派。
数据格式:CSV格式,包含features_30_sec.csv和features_3_sec.csv两个文件,方便数据读取和分析。数据已进行特征提取,可以直接用于模型训练。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于音乐信息检索、音频分析、机器学习等领域的学术研究,例如音乐流派识别、情感分析等。
行业应用:可以为音乐平台、内容推荐系统、音频搜索引擎等提供数据支持,用于优化音乐推荐算法、提升用户体验。
决策支持:支持音乐行业的市场分析,帮助音乐公司了解不同音乐流派的特征,制定更有效的市场策略。
教育和培训:作为音频处理、机器学习、数据科学等课程的实训材料,帮助学生掌握音频特征提取、模型构建等技能。
此数据集特别适合用于探索音频特征与音乐流派之间的关系,帮助用户构建音乐分类模型,实现自动化的音乐流派识别。