跳到主要内容

声音分类

关键技术：

短时傅里叶变换（STFT）：将声音转换为频谱图。
深度神经网络（DNN）：用于声音特征提取和分类。

处理环节：

数据收集：录制不同类别的声音样本（交互环节）
特征提取：使用STFT将声音信号转换为频谱图（内部环节）
模型训练：使用频谱图特征训练DNN，调整参数以提高分类性能（内部环节）
声音预测：模型对新声音进行分类，输出结果（交互环节）

01 - 数据收集

接下来将尝试一个最简单的，只有3个分类（前进与后退）的项目带同学们快速了解应用过程

首先理清我们需要制作的，是一个可以分辨“前进”与“后退”声音指令的模型，我们需要三个分类，分类1是默认分类，叫做 “噪声噪声”，分类2叫做 “前进”，分类3叫做 “后退”，接下来使用麦克风开始采集数据

背景噪声这个分类是很重要的，毕竟要分辨的是声音，而声音不是时刻发出的。

完善中...

01 - 数据收集