2012年8月27日,星期一

Liberman和语音代码的理解

Alvin Liberman位于科学鸿沟的中心。 一方面,在促进运动系统在感知中的作用的研究人员中,他对语音感知的运动理论的研究实际上已经提升为福音的地位。 另一方面,新一代的语音科学家相信语音感知是听觉系统的权限。 对于这些研究人员而言,利伯曼具有近乎恶毒的地位,或者至少代表了语言研究进展障碍的人格化。 全面披露:我倾向于后者。

因此,我决定回去阅读Liberman的一些原创作品。 我强烈建议您阅读研究领域中的较旧文献-有很多有用的信息! -当现代工作中无故引用数十年的成果或理论时,这一点尤其重要。 您会经常感到惊讶,几乎总是会学到一些重要的东西。 我必须承认,关于Liberman等人的工作,这是相当令人印象深刻的。 与麻省理工学院的一个包括肯·史蒂文斯(Ken Stevens)在内的小组一起,利伯曼(Liberman)和同事们通过其开拓性工作几乎定义了语音感知领域。 它技术精巧,理论上丰富,并生成了大量数据,这些数据定义了我们今天仍在努力解决的问题。

Liberman提出了一个有趣的信息提示,即体感信息最终推动了音素的感知。电机系统只是用作访问此信息的一种方式。 Here a quote:

关节运动及其感觉作用的介导 在声刺激和我们称为感知的事件之间。在其极端 和老式的形式,这种观点说我们过分模仿传入的 发出声音,然后对本体感受和触觉刺激做出反应 由我们自己的发音运动产生。  由于各种原因,这种极端立场是完全站不住脚的,… 我们必须假设该过程某种程度上是短路的– that is, that the 必须提及关节运动及其感官后果 不知不觉地发生在大脑中而不会进入外围。” (利比曼,1957年) p. 122

关于Liberman早期论文中最重要的部分, 语音代码的感知,我注意到一个有趣的并置。 一个开始的假设是,他们的分析应仅限于音素水平。 The article starts,
我们的目标是确定语音感知基础的某些条件。 我们将不考虑整个过程,而仅考虑苛刻流和大致对应于音素的感知水平之间的部分。 (第431页)
另一个是该组非常出名的观察结果,即在音节中并行传送有关音素信息的信息,在讨论涉及音素/ d /的合成版本的感知实验的上下文中,在下面的元音的上下文中,在此提到:
如果我们从 在右手端,我们听到/ d /加上元音或无声音;在任何时候 我们只会听到/ d /吗?之所以这样,是因为在每个 即时,提供有关两个音素(辅音和元音)的信息 –也就是说,音素正在并行传输。 (p。 436)
然后再继续几页,他们得出结论:
信息的这种并行传递在声学水平上产生了我们已经提到的影响的合并,并产生了近似音节尺寸的不可还原的声学段。 (第441页)。  
在本文结尾处还有一个:
要找到在任何合理简单的意义上都与语言(和感知)段不变的声学段……必须达到音节水平或更高。 (第451页)
这使我感到震惊,这是Liberman的工作出现问题的地方。 通过在理论上承诺必须在语音感知过程中提取和表示各个片段的概念,它们无法识别其数据清楚地告诉了他们什么:声音信号正在反射更大的信息块- 是,更接近音节。 当然,这种观察并不新鲜。 其他人指出了音素作为分析单位的问题。 但是,有趣的是重新考虑数据本身,而不是将音素视为一种感知单位的教条。 这是一个完全合理的假设,即音素不仅应与语音理论(即生产)有关,而且还应与感知有关。 不幸的是,这不必要地使感知画面复杂化。 我想知道,如果利伯曼做出不同的理论假设,他的工作可能会取得怎样的进展。 也许我们现在会理解语音的感知方式。




Liberman,A.M.(1957年)。关于语音感知的一些研究结果。 《美国声学学会杂志》,第29卷,第117-123页。

Liberman,A.M.,Cooper,F.S.,Shankweiler,D.P.,&Studdert-Kennedy,M。(1967)。语音代码的感知。心理疗法评论,74,431-461。