我这边主要就是简单的分析下加窗后的视频曲线,然后求倒谱距离,不知道还有什么其他方法?
大的方法前面二楼已经讲了。每个方法都有很多细节能影响对信号的识别度,就拿MFCC+DTW来讲,要不要先滤波,怎么滤波,要不要预加重,怎么预加重,窗的长度,窗的重叠比例,多少个MFCC谱组合在一起算DTW,MFCC的频带如何分区(分多少个,怎么分),MFCC的阶次用到多少阶,背景噪音是否要去除,是静态地还是动态地去除背景噪音,相似性的判断的阈值取在哪里....... yderek 发表于 2016-3-29 14:32
刚刚把您分享的资料大致看了一下,觉得我需要的几种不同环境音和机械音的应该比语言识别要简单,现在主要 ...
开源应该是源代码,如果你下载到的是exe的,那应该是经过别人编译的
比如http://www.pudn.com/downloads550/sourcecode/windows/detail2269387.html TestGuru 发表于 2016-3-29 20:44
大的方法前面二楼已经讲了。每个方法都有很多细节能影响对信号的识别度,就拿MFCC+DTW来讲,要不要先滤波 ...
谢谢您的回复,虽然我不是信号处理专业的,但是大概能听懂一点,我的MFCC用的16阶的,没有做降噪处理,窗的重叠比例为相邻帧长的一半,至于您说的相似性的判断的阈值是否和我划分的两类不同声音倒谱距离的分界线有关系,目前还不是很懂 NASA 发表于 2016-3-30 09:29
开源应该是源代码,如果你下载到的是exe的,那应该是经过别人编译的
比如http://www.pudn.com/downloa ...
下载的不是EXE的,倒是真希望能下载到EXE的,在linux下运行和编译的实在看不懂 yderek 发表于 2016-3-29 14:32
刚刚把您分享的资料大致看了一下,觉得我需要的几种不同环境音和机械音的应该比语言识别要简单,现在主要 ...
是C语言写的,至于是否适用于声音识别意外的就不太清楚了
页:
1
[2]