首页 > 分享 > python动物语音识别

python动物语音识别

Speech_Recognition_Test

中文语音识别

1、项目运行环境

Windows7x64

Pycharm 2018.2.4

Python 3.6.2

独立显卡 GTX1050Ti

2、项目运行所需的库文件

Numpy(用于矩阵运算)

tensorflow-gpu(GPU版本有助于加快训练速度)

scipy.io.wavfile(用于读取音频文件)

python_speech_features(用于获取音频的梅尔倒普系数)

3、项目训练所需数据

下载地址:http://www.openslr.org/18/

下载文件:data_thchs30.tgz

4、项目构建思路

1)将样本数据读入内存(包括音频数据和标签数据)

2)建立批次获取样本的函数

3)将语音数据转换成梅尔倒频谱系数(MFCC数据)(将时域数据转换成频域数据)

4)将MFCC转换成训练格式数据时间列和频率特征系数行的矩阵

5)文本转换成向量

6)用于读取文件操作

7)对齐该批次的音频数据

8)将文本数据转换成稀疏矩阵(也就是密集矩阵转换成稀疏矩阵)

9)字向量转换成文字

10)构建网络结构进行模型训练:BiRNN_model

11)调用cpu函数

12)读取待测试数据(包括音频数据和标签数据)

13)将数据代入已训练好的模型中

14)打印识别信息对比识别效果

5、项目运行方法

配置conf目录下的conf.ini中的各项,主要是配置训练和测试所需的数据文件的路径,训练模型和log文件保存路径

<

相关知识

几款免费的语音转文字工具推荐(附识别准确度排行榜)
宠物语音识别软件
语音情感识别调研
AI智能语音宠物语言识别APP下载,AI智能语音宠物语言识别APP v1.0
动物语音识别用什么算法
动物声音识别
一种利用宠物语音信号识别情绪的方法及系统与流程
传感器让电子宠物狗可识别语音命令
一种利用宠物语音信号识别情绪的方法及系统.pdf
Python实现可以语音聊天的桌面宠物程序

网址: python动物语音识别 https://m.mcbbbk.com/newsview171184.html

所属分类:萌宠日常
上一篇: Slash/基于pyqt5的原神
下一篇: 仓鼠通过什么识别主人?