跳到主要内容

声音分类

关键技术:

  • 短时傅里叶变换(STFT):将声音转换为频谱图。
  • 深度神经网络(DNN):用于声音特征提取和分类。

处理环节:

  1. 数据收集:录制不同类别的声音样本 (交互环节)
  2. 特征提取:使用STFT将声音信号转换为频谱图(内部环节)
  3. 模型训练:使用频谱图特征训练DNN,调整参数以提高分类性能(内部环节)
  4. 声音预测:模型对新声音进行分类,输出结果 (交互环节)

01 - 数据收集

接下来将尝试一个最简单的,只有3个分类(前进与后退)的项目带同学们快速了解应用过程

  1. 首先理清我们需要制作的,是一个可以分辨“前进”与“后退”声音指令的模型,我们需要三个分类,分类1是默认分类,叫做 “噪声噪声”,分类2叫做 “前进”,分类3叫做 “后退”,接下来使用麦克风开始采集数据

背景噪声这个分类是很重要的,毕竟要分辨的是声音,而声音不是时刻发出的。

完善中...