yderek 发表于 2016-3-22 11:12

【求助】关于环境噪音信号特征提取及识别




本人目前研究环境声音遇到了一些瓶颈,目前只是略微掌握MFCC(梅尔倒谱)方法去识别不同类别信号;


求问还有其他方法可以分析出信号特征并进行识别不同信号吗?

suffer 发表于 2016-3-22 11:57

经典的特征提取方法主要有LPCC(线性预测倒谱系数)、MFCC(美尔频率倒谱系数)、HMM(隐马尔科夫模型)、DTW(动态时间规整)等。

yderek 发表于 2016-3-22 14:08

suffer 发表于 2016-3-22 11:57
经典的特征提取方法主要有LPCC(线性预测倒谱系数)、MFCC(美尔频率倒谱系数)、HMM(隐马尔科夫模型)、D ...

非常感谢,目前只略微掌握了MFCC,不知道其他3中是否可以也区分出想要的结果

suffer 发表于 2016-3-22 16:11

yderek 发表于 2016-3-22 14:08
非常感谢,目前只略微掌握了MFCC,不知道其他3中是否可以也区分出想要的结果

这个不好说,都有局限性,和数据本身有关

yderek 发表于 2016-3-22 16:17

suffer 发表于 2016-3-22 16:11
这个不好说,都有局限性,和数据本身有关

那就好,目前用MFCC的方法还是取得了比较高的识别正确率,哪怕其他方法识别正确率不高,也能横向对比哪一个方法更佳

敢问您这边是否有上述几个方法(除了MFCC)的程序代码吗?

suffer 发表于 2016-3-22 16:25

yderek 发表于 2016-3-22 16:17
那就好,目前用MFCC的方法还是取得了比较高的识别正确率,哪怕其他方法识别正确率不高,也能横向对比哪一 ...

代码你可以到http://download.csdn.net/找
一般都能找到

dsp2008 发表于 2016-3-23 19:04

MFCC是一种经典、有效的方法。这样的经典方法可用于工程,若用于造文章恐怕就困难了。

yderek 发表于 2016-3-23 19:35

dsp2008 发表于 2016-3-23 19:04
MFCC是一种经典、有效的方法。这样的经典方法可用于工程,若用于造文章恐怕就困难了。

MFCC现在已经基本掌握了,求其他方法

yderek 发表于 2016-3-23 19:40

suffer 发表于 2016-3-22 16:25
代码你可以到http://download.csdn.net/找
一般都能找到

刚刚查到,HTK工具包适用于HMM方法提取声音特征并进行辨识;DSP上编写的语音识别程序也可以采用DTW(动态时间规整)的方法来实现声音识别;
无奈前者目前还找不到安装程序。后者应该是单片机吧?是否还需用其他变成语言来实现?

TestGuru 发表于 2016-3-25 09:35

MFCC识别也有很多参数可细调,曾用MFCC开发过有多路声音匹配软件,可自己录制样本。

Lorraine 发表于 2016-3-25 12:47

yderek 发表于 2016-3-23 19:40
刚刚查到,HTK工具包适用于HMM方法提取声音特征并进行辨识;DSP上编写的语音识别程序也可以采用DTW(动态 ...

HTK是一个开源工具包,可以在http://htk.eng.cam.ac.uk/进行免费下载

Lorraine 发表于 2016-3-25 12:50

HTK工具使用:

1. 模型建立及训练的官方式过程:HTK手册_第三章_中文版
http://wenku.baidu.com/view/80f961b9d0d233d4b14e699a.html

2. 3个孤立词模型建立及训练的详细过程:基于HTK语音工具包进行孤立词识别的使用教程
http://my.oschina.net/jamesju/blog/116151

3. HTK_basic_tutorial(即基础指南):HTK_basic_tutorial
http://wenku.baidu.com/link?url= ... ezErXAI1wPwH7q6FR4O

4. HTK_basic_tutorial(中文版):HTK(v3.1)基础指南中文版
http://wenku.baidu.com/view/1c606d4fe518964bcf847c81.html

5. HTK指南:HTK指南
http://wenku.baidu.com/view/992bcd09581b6bd97f19eac7.html

代码分析:

1. HTK源代码分析:HTK源代码分析
http://www.doc88.com/p-6813727388251.html

2. 语音识别HTK代码学习手册:
语音识别HTK代码学习手册
http://www.docin.com/p-243203295.html

百度文库——HTK代码学习手册
http://wenku.baidu.com/link?url= ... 9qXVuyXzaDheo7P_bZq

yderek 发表于 2016-3-29 13:36

TestGuru 发表于 2016-3-25 09:35
MFCC识别也有很多参数可细调,曾用MFCC开发过有多路声音匹配软件,可自己录制样本。

我这边主要就是简单的分析下加窗后的视频曲线,然后求倒谱距离,不知道还有什么其他方法?

yderek 发表于 2016-3-29 13:55

Lorraine 发表于 2016-3-25 12:50
HTK工具使用:

1. 模型建立及训练的官方式过程:HTK手册_第三章_中文版


感谢您给提供的这些资料,其中下载地址那个之前也去研究过,但是注册的时候有提示要提交一些ID,没太搞明白。看了中文版的手册,觉得对于语言来说识别正确率还挺高的,但是对于某些机械和环境声音不知道效果怎么样,可以实现不?

yderek 发表于 2016-3-29 14:32

Lorraine 发表于 2016-3-25 12:50
HTK工具使用:

1. 模型建立及训练的官方式过程:HTK手册_第三章_中文版


刚刚把您分享的资料大致看了一下,觉得我需要的几种不同环境音和机械音的应该比语言识别要简单,现在主要有以下几个问题和疑惑:
1、那个官网下载地址能下载到的是一个.exe的安装文件吗?如果是,目前还没搞明白怎么下载
2、假设HTK工具箱是一个安装程序,那么在进行训练的时候可以识别电脑里已经存在的声音文件吗?
3、假设1和2条同时成立,在进行目的声音识别的时候,可以把其他声音当做未知声音通过已经训练好的样本声音进行识别吗,并且可以得到比较高的识别正确率?
4、HTK的变成语言是C语言吗?
页: [1] 2
查看完整版本: 【求助】关于环境噪音信号特征提取及识别