音高和频率(续三)
February 13, 2008 11:18 pm GMT-0700 | In StudyFang 在《写作的重要性》一文中提到:看完书不写读后就好像做完题目不写成 paper,不是好习惯。在这个方针的指引下,我在过去几年看的音乐方面的书该摘录的前面三篇差不多写完了,这里补点小问题作个尾巴吧。
音高感知:比较流行的理论是,几百赫兹以下大脑是直接数周期来确定音高的,1600 Hz 以上则主要靠内耳频谱分析,中间频率段两种机制都在起作用。
声源定位:人有俩耳朵,定位声源主要靠分辨声音到达耳朵的时间差。比较令人惊讶的是,虽然声音感知的神经脉冲有 100 微秒,但是人可以分辨的时间差在 10 微秒的量级。另外,左右耳的声强和频谱对比也对判断声源有帮助,比如,右边来的声音在右耳听起来会亮一些,因为声波经过圆型头部的时候高频被吸收得多。
还有一个有趣的现象是声源的上下定位。人即使不移动脑袋,也是可以感觉到正前方声源的上下位置的,而这种声源对左右耳完全对称,因此也不可能用左右耳差异来判断位置。实验发现,如果堵上耳朵或者改变耳廓形状,人的声源上下定位能力就会减弱或者消失。流行理论是人对预定声音的频谱会有记忆,而声源上下移动会在耳廓上产生不同的反射模式,特别会影响高频部分的频谱,人估计就是从高频频谱里得到声源位置的暗示的。实验也发现,如果编造不熟悉的声音,人对声源高度的判断就不会那么准确了。
另外,一般在房间里声源到接受者耳朵里不光有直接声波还有大量墙壁和地面的反射波。首先,人会选取最先听到的直接声波判断出声源的位置;其次,人也会利用反射波的信息来感知房间大小。实验发现,如果把房间墙壁搞成完全吸收声波,哪怕再小的房间人也不会感觉到房间很小(当然这个实验需要把人眼睛蒙起来)。
鸡尾酒会效应:Cocktail party effect,听觉系统的一种选择能力。在鸡尾酒会上即使周围噪声很大,我们还是可以听到朋友说的内容。听音乐时,人如果专注于一样乐器,也可以跟随那个乐器的声音。这种能把注意力集中在某个声音上的现象就是鸡尾酒会效应,这和视觉里人可以在纷乱的背景中看出熟悉的图形可能是类似的机制。大凡自然界的声音、人声和乐器都会略有噪音和瑕疵,实验发现人对声音里面这种瑕疵非常敏感,这也很可能是人分辨相近声音的主要线索。两个人说话或者两种乐器演奏,频谱一般有很明显的不同,所以人能分辨出来并不奇怪;两把几乎相同的小提琴一起演奏,人还是可以听出有两把小提琴,这是因为两个乐器各有各的瑕疵,演奏的人也可能技巧略有不同。电子合成的乐音如果不加瑕疵,听起来很机械,完全没有美感,两个不加瑕疵的电子小提琴一起演奏,人是分辨不出来的。可见完美的世界并不美好,我们需要一定的个性才能让这个世界变得有趣。
最后推荐一本书 Music, Cognition, and Computerized Sound: An Introduction to Psychoacoustics,这本书是 Stanford Center for Computer Research in Music and Acoustics (CCRMA) 的一帮人根据教学经历整理的。这个多学科研究中心集结了音乐、计算机、电子和机械工程、物理和心理方面的大牛,成立多年虽无重大突破,但是成功改变了过去各个学科独自研究音乐的局面,算是在这个交叉学科领域走出了重要的一步。
Tags: ear, instrument, music, sound
9 Comments »
RSS feed for comments on this post.
Leave a comment
This weblog is licensed under a Creative Commons License.
Powered by WordPress. Theme based on Pool by Borja Fernandez.
瑕疵是天然的还是可以添加的?怎么控制的好啊?
Comment by Orz — February 15, 2008 4:37 pm GMT-0700 #
一般的乐器都会略有瑕疵,电子合成音乐也可以有控制的添加一些噪声。至于怎么控制的好,显然,我是一个不学无术只知道空对空放屁的民间科学家,问我就问错啦:p (事实是,主要靠试验,没有什么标准,哈哈……)
Comment by atppp — February 15, 2008 8:52 pm GMT-0700 #
很有意思的讲解。问几个问题:
音乐里的节拍是固定的吗?频谱分析是做FFT变换吗?节拍对频谱分析有什么影响?
Comment by wony — February 16, 2008 6:04 am GMT-0700 #
节拍不固定,频谱分析一般用移动窗口的FFT,窗口大小会影响频谱分析。一般来说,窗口越大,频率轴上越准确,但是在时间轴上会比较模糊,可能忽略掉一些短暂的细节。比如语言分析里面,一般用小窗口寻找发声的开始和结束时间,用大窗口寻找准确的频率信息(如果高频信息不准确,s和f是没有区别的……)。
Comment by atppp — February 16, 2008 11:04 am GMT-0700 #
fang是个很神奇的人呢。
Comment by ppip — February 17, 2008 5:55 am GMT-0700 #
神!谢了。盼有其它的内容写出来。相信会同样精彩。
Comment by Milo — April 13, 2008 6:47 am GMT-0700 #
转载一下好不?需要注明什么?作者?链接?
Comment by wen — August 2, 2010 4:17 am GMT-0700 #
链接就好啦。。
Comment by atppp — August 3, 2010 12:49 am GMT-0700 #
这是我看到过的最有用的解答了,开启了我对声学兴趣的进一步大门。。空了继续弹弹钢琴。。。
Comment by 桃白白 — November 8, 2021 10:46 pm GMT-0700 #