首页 > 分享 > 基于快速傅里叶变换实现的狗声识别器(人工智能)

基于快速傅里叶变换实现的狗声识别器(人工智能)

开发背景

市场上很多宠物狗狗翻译器,猫语翻译器,动物交流器,它们没有采用正确的技术去实现,从而让动物声音翻译器变成人们笑料的工具。本人为了改变现状,刚好被裁员在家里休息,所以努力开发一款真正意义上能识别出动物声音的翻译器。总计耗时1个月(算法折腾半个月,js折腾半个月),躺了几次中医推拿才初步开发完成。整体只完成梦想的一小步,后续只能交给追梦者继续完善。
项目地址:https://github.com/windawake/dogsound

功能介绍

可以识别出包括狗狗在内的所有动物发出的声音,前提是先录音存到声音档案里面。

预览网址

使用手机火狐浏览器访问 https://app.jiajuren.net/ 同意开启录音和麦克风权限。

运行项目

运行环境:nginx+ssl+php+mysql

创建bowwow数据库 CREATE DATABASE bowwow; 然后执行根目录bowwow.sql文件,接着把app copy.json修改为app.json并且配置mysql连接参数

在根目录运行 php -S 0.0.0.0:13000 -t .
nginx反向代理到13000端口
参考配置

server {listen 3000 ssl http2;ssl_certificate /web/linux/vscode/ssl/server.crt; ssl_certificate_key /web/linux/vscode/ssl/server.key;add_header Access-Control-Allow-Origin *;server_name 0.0.0.0;index index.php index.html index.htm index.nginx-debian.html;location / {proxy_pass http://127.0.0.1:13000;} } 1234567891011

最后访问https://127.0.0.1:3000 即可看到本地效果

实现原理

运用了移位运算,门阀检测声音,短时能量,短时过零率,短时快速傅里叶变换等技术,请参考这本书《语音信号处理实用教程》

注意事项

必须要https才能开启录音和麦克风权限

需要安静室内环境,录音要自然,识别时的发音要跟录音时的节奏一致。这样子才能达到80%识别率。室外在噪音干扰下,识别率几乎为0。

原文出处

https://learnku.com/articles/71608

相关知识

毕业设计:基于深度学习的动物叫声识别系统
一种基于人工智能的智能宠物训练助手系统的制作方法
人工智能行业中宠物识别技术如何?
“鸟脸”识别落地亦城!人工智能破解野生动物监测难点
动物声音识别
基于卷积神经网络通过声音识别动物情绪的方法及系统与流程
智能喂鸟器走俏,大多数硬件可以用“摄像头”重新做一遍?
一种基于深度残差网络的宠物图像情绪识别方法与流程
宠物声音识别与理解研究.pptx
需要伦理的人工智能应用——读 于江生著《人工智能伦理》

网址: 基于快速傅里叶变换实现的狗声识别器(人工智能) https://m.mcbbbk.com/newsview171253.html

所属分类:萌宠日常
上一篇: 应激反应有多可怕?严重会致使猫咪
下一篇: 如何用机器学习识别猫叫和狗叫声?