关于等响曲线的秘密
想必从事音频或声学相关工作的朋友或多或少都听过“等响曲线(Equal - Loudness Contour)”这个词,但大部分人可能对它只有模糊的概念。实际上,不管是进行声学测量,扬声器或耳机的研发生产,还是音响工程或内容制作中的调音/混音,理解等响曲线都有非常重要的意义。
等响曲线是一系列通过主观测量得出的响度级一致的曲线,简单理解就是 - 同一曲线上不同频率的声压级不同但人耳听感相同。
ISO 226: 2003 标准中确定的等响曲线
现代等响曲线的测定并非一帆风顺,因为人耳非常主观,合理的实验方法非常重要。人们也付出了非常多的努力。
测量方法
测定等响曲线的总体实验逻辑是,让参与测试的人员同时或依次听正弦波参考信号(一般是 1 kHz,也称千周信号)和各个频率的正弦波测试信号,调节信号大小,当受试人员认为测试信号和参考信号听起来一样响时,记录下信号大小,最后汇总并拟合出曲线。测试的范围从听力阈值到疼痛阈值,即从完全听不到声音,到声音大到让人不适。
测量前,科学家们必须严格筛选受试人员,确保他们身心健康,最重要的是 - 不能有任何听力缺陷。也不能选择小孩或老人,小孩尚未发育完全,而随着年龄的增长,人对高频声音的敏感度会逐渐降低。
早在 1927 年,已经有科学家从事这方面的研究,但真正取得大众认可研究成果的是 1933 年。
弗莱彻 - 蒙森曲线
Fletcher - Munson Curves
哈维·弗莱彻(Harvey Fletcher,1884 - 1981)物理学家,被称作“立体声”之父
弗莱彻和蒙森(Harvey Fletcher 和 Wilden A. Munson)两位科学家邀请了 11 位合格的受试人员,让他们戴上立体声耳机后在实验环境中测试,测试的频率范围从 62 Hz 至 16 kHz,声压级跨度也很大,从 -10 dB 至 130 dB。因为戴上耳机后人耳和耳机之间实际上是一种压力场,他们还进行了自由场修正以得到更实际的结果。
声音波长比其所在空间的尺寸还大,声音分布均匀的声场叫压力场。声音能量均匀,直达声和反射声混在一起,在各个方向无规则分布,这样的声场就是扩散场或混响场。相对应的是自由场,也就是声音发出去就不回来的声场,消声室就是人造的自由场。
图中的蓝色曲线便是弗莱彻 - 蒙森曲线的一部分,红色则是现行标准中的曲线
这些曲线能为我们提供非常多的信息,比如人耳在 3 kHz 左右最为灵敏,只要很低的声压级就能让人感觉同样的响度,而小于 500 Hz 或高于 10 kHz 时,听音的偏差会很大。
弗莱彻 - 蒙森曲线的影响力非常大,现在还有不少人习惯用这个曲线指代等响曲线,但从上图也能看出,现代等响曲线和最初的弗莱彻 - 蒙森曲线已经有了很大差异。
在弗莱彻和蒙森之后很长时间内,关于等响曲线的研究似乎停滞不前,尽管 1937 年有人做了类似实验并得出一些曲线,但结果偏差很大,并没有引起太大反响。
直到 1956 年,又是两个科学家 - 罗宾逊和达森关注到了这些差异的存在,决定重新进行研究。
罗宾逊 - 达森曲线
Robinson - Dadson Curves
罗宾逊和达森认为,尽管 1933 年的实验进行了自由场修正,但在真正的自由场消声室中能得到更精确的数据。
另外,二十多年前的回放设备性能也相对落后。虽然高品质耳机可以在耳道中产生非常平坦的低频响应,但高频部分很容易在外耳产生共振从而影响结果,耳机发出的“侧入声”和现实中人耳的听音场景也不同,现实中人的头部也对声音有一定的掩蔽作用。
标准信号和共振后叠加的信号
当时的高品质同轴扬声器已经足以准确发出高达 20 kHz 的声音,将它放在一个空间较大的消声室中远离地面,可以让低频部分的表现也满足实验要求。将这样的单支扬声器放在受试人员的正前方,从而将人头部的声学效应考虑在内。
罗宾逊 - 达森实验
罗宾逊和达森更挑选了 90 位从 16 岁到 63 岁和 30 位 30 岁左右的受试者参与实验,保证样本的多样。测量频率为 25 Hz - 15 kHz。
总之经过一系列改进,他们的实验精度对比 20 多年前有了很大提高。并最终得到了罗宾逊 - 达森曲线。
这个曲线出现后获得了国际上的广泛认可,在 1961 年就被国际标准化组织 ISO 采纳,并最终在 1987 年被正式写入 ISO 226 标准。
可没过几年,就有研究人员发现,他们测出的结果在 400 Hz 和罗宾逊 - 达森曲线差异非常大,之后这种差异被众多学者证实,他们发现在 800 Hz 以下的低频,某些频率的差异高达 15 dB。
联合实验
多个国家的研究者决定独立展开联合实验,他们再次改进测试方法,并汇总各个国家的数据。
比如,1933 年和 1956 年,科学家们调节 1 kHz 参考信号的大小让受试人员与测试信号对比,而联合实验中将 1 kHz 信号的大小进行统一,转而调节测试信号大小。
受试对象则选择更年轻的 18 - 25 岁为主的人群。最终,他们的数据获得了国际认可,并在 2003 年写入 ISO 226 标准,取代了罗宾逊 - 达森曲线。
至于为什么历年的结果会存在显著差异,目前并没有统一的解释。学界普遍认为有以下几种可能:
某些测试中设备没有能进行正确校准;
某些受试人员在测试前长时间乘坐交通工具,听力受到了一定干扰;
近百年的跨度中人对不同频率听音的判断标准有变化;
人种不同听力可能有区别(主要证据是联合实验中日本的数据,近年来我国的研究数据也和国际标准有一定差异,东亚人在大多数频率似乎比西方人更敏感);
也有人提出应该对压力场和自由场分别测试并制定标准。
曲线解读
下图就是目前通用的国际标准 ISO 226: 2003 中定义的等响曲线。我们的国家标准 GB/T 4963-2007:声学 - 标准等响度级曲线中采纳了相同的数据。
这幅图并不难理解,主要涉及三个单位,横轴代表频率,纵轴代表声压级,而曲线本身代表了各自的响度级,单位为“方(phon)”,方实际上等于曲线在 1 kHz 处的声压级,它和分贝(dB)一样,都是对数单位,响度级和声压级也可以互相计算。
图中有三条虚线非常显眼:
最下方用短划线表示的就是人耳的听阈,比这还小的声音我们就听不到了;
听阈和 20 方之间实际上没有实验数据,所以这里的 10 方用虚线表示,仅供参考;
100 方的数据样本过少,所以也用虚线表示。
曲线中最值得我们关注的是 40 方曲线,声学测量中使用的 A 计权就是基于这个曲线;类似的,C 计权基于 100 方曲线。过去还有基于 70 方曲线的 B 计权,现在已经不再使用。
很多实用主义者还有一个困惑,比如现在要设计一个音效,为了达到最佳效果需要根据等响曲线进行优化,又不能每个声压级都优化一遍,该怎么办呢?这里推荐以 80 方曲线为参考,因为在大部分使用场景下,80 dB 都是比较合理的声压级。
非常棒的科普,谢谢 感谢分享
页:
[1]