声音分类
关键技术:
- 短时傅里叶变换(STFT):将声音转换为频谱图。
- 深度神经网络(DNN):用于声音特征提取和分类。
处理环节:
- 数据收集:录制不同类别的声音样本 (交互环节)
- 特征提取:使用STFT将声音信号转换为频谱图(内部环节)
- 模型训练:使用频谱图特征训练DNN,调整参数以提高分类性能(内部环节)
- 声音预测:模型对新声音进行分类,输出结果 (交互环节)
01 - 数据收集
接下来将尝试一个最简单的,只有3个分类(前进与后退)的项目带同学们快速了解应用过程
- 首先理清我们需要制作的,是一个可以分辨“前进”与“后退”声音指令的模型,我们需要三个分类,分类1是默认分类,叫做 “噪声噪声”,分类2叫做 “前进”,分类3叫做 “后退”,接下来使用麦克风开始采集数据
背景噪声这个分类是很重要的,毕竟要分辨的是声音,而声音不是时刻发出的。
完善中...