Speech_Recognition_Test
中文语音识别
1、项目运行环境
Windows7x64
Pycharm 2018.2.4
Python 3.6.2
独立显卡 GTX1050Ti
2、项目运行所需的库文件
Numpy(用于矩阵运算)
tensorflow-gpu(GPU版本有助于加快训练速度)
scipy.io.wavfile(用于读取音频文件)
python_speech_features(用于获取音频的梅尔倒普系数)
3、项目训练所需数据
下载地址:http://www.openslr.org/18/
下载文件:data_thchs30.tgz
4、项目构建思路
1)将样本数据读入内存(包括音频数据和标签数据)
2)建立批次获取样本的函数
3)将语音数据转换成梅尔倒频谱系数(MFCC数据)(将时域数据转换成频域数据)
4)将MFCC转换成训练格式数据时间列和频率特征系数行的矩阵
5)文本转换成向量
6)用于读取文件操作
7)对齐该批次的音频数据
8)将文本数据转换成稀疏矩阵(也就是密集矩阵转换成稀疏矩阵)
9)字向量转换成文字
10)构建网络结构进行模型训练:BiRNN_model
11)调用cpu函数
12)读取待测试数据(包括音频数据和标签数据)
13)将数据代入已训练好的模型中
14)打印识别信息对比识别效果
5、项目运行方法
配置conf目录下的conf.ini中的各项,主要是配置训练和测试所需的数据文件的路径,训练模型和log文件保存路径
<
相关知识
几款免费的语音转文字工具推荐(附识别准确度排行榜)
宠物语音识别软件
语音情感识别调研
AI智能语音宠物语言识别APP下载,AI智能语音宠物语言识别APP v1.0
动物语音识别用什么算法
动物声音识别
一种利用宠物语音信号识别情绪的方法及系统与流程
传感器让电子宠物狗可识别语音命令
一种利用宠物语音信号识别情绪的方法及系统.pdf
Python实现可以语音聊天的桌面宠物程序
网址: python动物语音识别 https://m.mcbbbk.com/newsview171184.html
上一篇: Slash/基于pyqt5的原神 |
下一篇: 仓鼠通过什么识别主人? |