lovelydeath 发表于 2007-5-25 22:02

求助关于声音信号的的处理

声音信号是一个非平稳信号 怎么得到功率谱 来从中获得特征参数啊 谢谢大家赐教:@)

zhlong 发表于 2007-5-25 22:04

那你得用非平稳信号处理方法吧,如时频分析,小波,EMD等。
特征参数很多,比如时频熵、小波能量等等!

lovelydeath 发表于 2007-5-25 22:07

能说的具体一些不?我把它分成很多小段 然后求功率谱行不行?

zhlong 发表于 2007-5-25 22:31

你说的意思其实就是短时傅立叶变换 (Short time Fourier Transform : STFT)。
其实我看到很多语音信号处理都是采用AR模型的,你可以试一下分段AR模型,提取AR模型系数作为特征参数。

zhlong 发表于 2007-5-25 22:38

或者采用时变AR模型,就是AR模型的系数是随时间而变化的,这种模型能较好地处理非平稳信号。

zhlong 发表于 2007-5-26 16:23

回复 #6 lovelydeath 的帖子

具体怎样的方法?发出来大家看看吧

lovelydeath 发表于 2007-5-26 16:44

这个是我的参考资料 我得不到第5第6页的那种频谱 而后面的求距离,阈值都是按照他的写的 现在就是差这一步了 教教我拉

zhlong 发表于 2007-5-26 17:54

我也不太清楚你的频谱是怎么来的,按一般理解的话,短时傅立叶是由很多不同时刻的频谱叠加而成的。而第三个图中你的频谱只有一段,也不知道是哪个时段的。希望有明白人解释一下!谢谢!!!

[ 本帖最后由 zhlong 于 2007-5-26 17:55 编辑 ]

lovelydeath 发表于 2007-5-26 18:57

现在得不到图很着急

yangzj 发表于 2007-5-26 19:59

参考帮助

Fs = 32e3;
t = 0:1/Fs:2.96;
x = cos(2*pi*t*1.24e3)+ cos(2*pi*t*10e3)+ randn(size(t));
Pxx = periodogram(x);
Hpsd = dspdata.psd(Pxx,'Fs',Fs);   % Create a PSD data object.
plot(Hpsd);                        % Plot the PSD data object.

zhlong 发表于 2007-5-26 20:03

yangzj版主,这个是楼主资料中说的短时傅立叶变换吗?
楼主好像说是短时傅立叶,还加了256长度的海明窗

yangzj 发表于 2007-5-26 20:06

回复 #12 zhlong 的帖子

从图三来看,我觉得他并不是做的一个短时傅立叶变换,而是做的一个功率谱密度函数,你觉得呢?

yangzj 发表于 2007-5-26 20:10

下载了资料大概看了下,资料里就是按平稳信号来处理的。看这一段

语音信号是一种典型的非平稳信号,但是由于语音的形成过程是与语音器官的运动密切相关的。这种物理运动比起声音振动速度要缓慢的多。因此,语音信号常常可以假定为短时平稳的。在10~30ms这样的时间段内,其频谱特性和某些物理特征参量可近似地看作是不变的。这样我们可以采用平稳的分析方法来处理。

zhlong 发表于 2007-5-26 20:10

是啊,我也是这么觉得。
可是楼主的资料里的文字材料都说短时傅立叶,还给了公式,还说明了语音信号的非平稳信。
按道理说语音信号是典型的非平稳信号,不适合FFT。

不知道怎么回事,是不是我还没理解楼主的材料。我都看了一个小时,愣是没搞懂。

zhlong 发表于 2007-5-26 20:12

回复 #14 yangzj 的帖子

那他后面的加窗、STFT的公式怎么回事?
而且一个语音信号,就如“开门”两个字的信号也不止10~30ms长度,那该提取哪一段用于做功率谱呢?
页: [1] 2 3
查看完整版本: 求助关于声音信号的的处理