音乐流派分类音频特征数据集MusicGenreClassificationAudioFeatureDataset-ahmadfakhar

音乐流派分类音频特征数据集MusicGenreClassificationAudioFeatureDataset-ahmadfakhar

数据来源:互联网公开数据

标签:音乐流派, 音频特征, 机器学习, 声音识别, 数据分析, 时域特征, 频域特征, 音乐分析

数据概述: 该数据集包含从多种音乐流派中提取的音频特征,用于音乐流派的分类任务。主要特征如下: 时间跨度:数据未明确标注时间范围,可视为静态音频特征集合。 地理范围:数据来源未明确,但涵盖了多种音乐流派,具有一定的普适性。 数据维度:数据集包含两份CSV文件,分别提取了30秒和3秒音频片段的特征。主要特征包括: 文件名称(filename):音频文件名。 时长(length):音频时长,以采样点数计。 色谱图均值和方差(chroma_stft_mean, chroma_stft_var):表示音频的音高分布。 均方根能量均值和方差(rms_mean, rms_var):表示音频的能量。 频谱质心均值和方差(spectral_centroid_mean, spectral_centroid_var):表示音频的频率重心。 频谱带宽均值和方差(spectral_bandwidth_mean, spectral_bandwidth_var):表示音频的频率分布范围。 滚降频率均值和方差(rolloff_mean, rolloff_var):表示音频的频率衰减点。 过零率均值和方差(zero_crossing_rate_mean, zero_crossing_rate_var):表示音频的过零次数。 谐波均值和方差(harmony_mean, harmony_var):表示音频的谐波成分。 感知特征均值和方差(perceptr_mean, perceptr_var):表示音频的感知特性。 节奏(tempo):音频的节奏信息。 梅尔倒谱系数均值和方差(mfcc1_mean ~ mfcc20_var):表示音频的梅尔频率倒谱系数。 标签(label):音频所属的音乐流派。 数据格式:CSV格式,包含features_30_sec.csv和features_3_sec.csv两个文件,方便数据读取和分析。数据已进行特征提取,可以直接用于模型训练。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于音乐信息检索、音频分析、机器学习等领域的学术研究,例如音乐流派识别、情感分析等。 行业应用:可以为音乐平台、内容推荐系统、音频搜索引擎等提供数据支持,用于优化音乐推荐算法、提升用户体验。 决策支持:支持音乐行业的市场分析,帮助音乐公司了解不同音乐流派的特征,制定更有效的市场策略。 教育和培训:作为音频处理、机器学习、数据科学等课程的实训材料,帮助学生掌握音频特征提取、模型构建等技能。 此数据集特别适合用于探索音频特征与音乐流派之间的关系,帮助用户构建音乐分类模型,实现自动化的音乐流派识别。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 5.12 MiB
最后更新 2025年5月26日
创建于 2025年5月26日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。