Keras深度学习实战(39)——音乐音频分类

    • 0. 前言
    • 1. 数据集与模型分析
      • 1.1 数据集分析
      • 1.2 模型分析
    • 2. 歌曲流派分类模型
      • 2.1 数据加载与预处理
      • 2.2 模型构建与训练
    • 3. 聚类分析
    • 小结
    • 系列链接

0. 前言

音乐音频分类技术能够基于音乐内容为音乐添加类别标签,在音乐资源的高效组织、检索和推荐等相关方面的研究和应用具有重要意义。传统的音乐分类方法大量使用了人工设计的声学特征,特征的设计需要音乐领域的知识,不同分类任务的特征往往并不通用。深度学习的出现给更好地解决音乐分类问题提供了新的思路,本文对基于深度学习的音乐音频分类方法进行了研究。首先将音乐的音频信号转换成声谱作为统一表示,避免了手工选取特征存在的问题,然后基于一维卷积构建了一种音乐分类模型。

1. 数据集与模型分析

在本节中,我们将研究对音乐音频进行分类,当我们能够使用深度学习模型对歌曲类型自动分类时,可以极大程度的减少人工成本。

1.1 数据