首页 > 分享 > python动物语音识别

python动物语音识别

萌宠菠菠乐园
2024-09-17 02:39

Speech_Recognition_Test

中文语音识别

1、项目运行环境

Windows7x64

Pycharm 2018.2.4

Python 3.6.2

独立显卡 GTX1050Ti

2、项目运行所需的库文件

Numpy(用于矩阵运算)

tensorflow-gpu(GPU版本有助于加快训练速度)

scipy.io.wavfile(用于读取音频文件)

python_speech_features(用于获取音频的梅尔倒普系数)

3、项目训练所需数据

下载地址：http://m.openslr.org/18/

下载文件：data_thchs30.tgz

4、项目构建思路

1)将样本数据读入内存(包括音频数据和标签数据)

2)建立批次获取样本的函数

3)将语音数据转换成梅尔倒频谱系数(MFCC数据)(将时域数据转换成频域数据)

4)将MFCC转换成训练格式数据时间列和频率特征系数行的矩阵

5)文本转换成向量

6)用于读取文件操作

7)对齐该批次的音频数据

8)将文本数据转换成稀疏矩阵(也就是密集矩阵转换成稀疏矩阵)

9)字向量转换成文字

10)构建网络结构进行模型训练：BiRNN_model

11)调用cpu函数

12)读取待测试数据(包括音频数据和标签数据)

13)将数据代入已训练好的模型中

14)打印识别信息对比识别效果

5、项目运行方法

配置conf目录下的conf.ini中的各项，主要是配置训练和测试所需的数据文件的路径，训练模型和log文件保存路径

原文链接: python动物语音识别 https://m.mcbbbk.com/newsview171184.html

分类：萌宠日常

上一篇: Slash/基于pyqt5的原神...

下一篇: 仓鼠通过什么识别主人?

求问成都哪儿可以买到仓鼠！？

被仓鼠咬了要打狂犬疫苗吗？兽医说了大实话，别白花钱或瞎担心

分享热点排名

养玉米蛇的危害

原创主人用这6种方式惩罚狗狗，会让它“惶恐不安”

推荐分享

缅因猫能长多大一种体型较大的猫

警惕狗贩的骗人损招星期狗的症状特征

即时知识

阿拉伯灵缇

玛尔济斯

分享分类导航

萌宠日常

宠物饲养指南

宠物营养食谱