2014年3月5日,星期三

语音表达中的分层和独立表示级别:HSFC模型的讨论


如2012年所详述 会说话的脑子,格雷格(Greg)和同事们提出了一种语音产生模型,该模型旨在综合运动控制,心理语言学和神经科学方面的研究。今年, 语言,认知和神经科学e(重新命名 语言和认知过程)由来宾编辑 阿尔伯特·科斯塔F.Xavier Alario。它 featured 一篇文章 由Greg概述了此模型的后代,即分层状态反馈控制模型(HSFC)。此目标文章随附了许多评论,包括 由我们两个人合着, 布伦达·拉普(Brenda Rapp),作为 well as a 响应 由格雷格。

We (Matt 和 Adam) wanted to take advantage of the extra space afforded by 会说话的大脑 to continue this conversation. The H in HSFC emphasizes the key role of 等级制 表述 in Greg's proposal. In this post, we'd like to articulate why psycholinguists 和 neuroscientists have argued that in addition to such 等级制 表述, distributed/parallel encoding plays a critical role in language production.

要确定讨论的方向,请从视觉考虑两种经典的神经认知表征结构:

1) Hierarchical 表述。在具有这种类型结构的表示中,两组表示之间存在映射(必要的关系)。  Consider 经典简单与复杂单元格(胡贝尔& Wiesel, 1962)。根据该提议,简单单元优先响应视野中特定位置的定向条。通过整合许多简单单元格上的响应,复杂单元格可以响应多个位置上的定向条。至关重要的是,在这两种表示形式之间存在精确的映射。复杂单元格的响应属性由在简单单元格的响应属性上陈述的函数定义。 

2) 平行,独立 representations。在具有这种类型的结构的表示形式中,两组表示之间的关系不是由直接映射定义的,直接映射将一个级别用另一级别拼出;相反,它们是结构的独立维度。这些维度可以链接或绑定在一起,但不一定必须同时存在。 考虑一下Treisman及其同事的经典特征整合理论,该理论声称视觉刺激的某些维度最初是独立处理的,后来才绑定在一起。 该建议提供了虚幻连接的现成说明 (特里斯曼& Schmidt, 1982)。例如,如果字母标识和颜色是分别编码的,则可以解释绿色显示的方式 Xs和棕色 Ts可能导致对绿色的错误认识 T;如果字母标识和颜色以单个表示形式编码,则这种感觉不太可能。至关重要的是,必须对两种类型的信息进行独立(但并行)编码,以使这些虚幻的结合在以后的绑定过程中发生。 

The HSFC model emphasizes the role of 等级制 表述. There is abundant evidence that these play a role in speech production. With respect to speech motor control, many accounts adopt a syllable-sized, relatively coarse-grained specification of motor movements, which directly maps onto detailed information regarding the precise temporal 和 kinematic coordination involved in production. There is also evidence that there are multiple levels of segment-sized 表述 that specify different types of information. A classic distinction is between 声音结构的上下文无关与位置特定方面。上下文无关的表示形式编码有关声音的信息(例如/ t / in 稳定),然后将它们映射到特定位置的表示形式,以详细说明细节(例如, 包含抽气[th]和 稳定 包含未吸气[t])。这些构成不同级别代表的证据包括来自获得性言语障碍的个人的数据(布赫瓦尔德& Miozzo, 2011)。尽管当前的HSFC模型中没有直接指定,但显然与Greg的建议中的总体说明一致。 响应.  

But what we'd like to emphasize is that parallel, independent 表述 also play a key role in language production. In particular, there's abundant reasons to believe that 在 certain levels of representation syllabic 和 segmental structure are not organized in a strict 等级制 fashion, but rather form parallel aspects of form representation. A number of results suggest that rather than syllables being defined as chunks of segments, syllable structure defines a frame; segments are then bound or linked to positions within this frame (see 戈德里克,在新闻中, 复习和讨论语音结构的其他方面)。 

To make this contrast explicit, consider the syllable "cat." Under a strictly 等级制 theory, this syllable could be defined by a mapping from [kaet] to the component segment [k-Onset] [ae-核仁[t-Coda]。在利用独立表示的理论下,有一个[开始]-[核]-[Coda]音节框架,并且独立地有三个片段/ k /,/ ae /,/ t /。音节由绑定/ k /-[Onset]表示; / ae /-[核仁]; / t /-[Coda]。

支持独立表示视角的第一种证据来自生产中的虚幻联系。语音错误可能会导致片段排序错误。在大多数此类错误中,音节出现在错误的音节但音节位置正确(例如, 坏猫 被误认为是“不好 b但是,相当少数(自发言语语料中的错误的20%以上; 沃登,布朗,& Harley, 2000)导致在错误的音节位置产生错误(例如, 电影 被误认为是“ flim”)。就像字母标识和颜色形成独立的视觉表示形式的可分离维度一样,段标识和音节位置也形成了生产中语音表示形式的可分离维度。

从启动的证据可以得出类似的结论。颜色和对象名称之间的分段重叠有助于着色对象命名,即使这些段出现在不同的音节位置(例如, g雷恩·弗拉g达米安& Dumay, 2009)。此外,与不具有匹配结构的非单词相比,两个无意义单词具有相同结构的音节时,也有利于由两个无意义单词组成的短语的生成-即使两个音节之间没有共享的句段(赛维尔,戴尔,& Cole, 1995)。例如,重复两个都以CVC音节开头的非单词 (例如,KEM TIL.FER)或CVCC音节(KEMP TILF.NER)的速度,比重复以反辅音元音模式(例如,KEM TILF.NER或KEMP TIL.FLER)的音节开头的非单词快。尽管音节不共享任何段(例如KEM和TIL),也会发生这种情况。

根据这些数据, 心理语言学理论(例如, Shattuck-Hufnagel,1992年) have proposed that syllables 和 segments are not related in a strictly 等级制 fashion, but rather form independent-yet-linked dimensions of sound structure. That's not to say that the links are purely arbitrary; only certain segments can be associated to particular syllable positions (e.g., in English, /ng/ can be associated to coda but not onset). But segments are not merely the "elaborated" form of syllabic chunks; they form independent entities.

While 等级制 表述 are a critical part of speech production, it's important to acknowledge the critical role of non-hierarchical representation. Mirroring other domains of processing, both representational schemas serve critical functions 在支持语音的神经认知机制中。 

参考文献
布赫瓦尔德,A。& Miozzo, M. (2011). 在语音制作中查找抽象级别: 来自声音产生损伤的证据。 心理科学,22岁, 1113-1119.
达米安(M. F.),&Dumay,N.(2009年)。通过重复的片段探索语音编码。 语言和认知过程24685-712。
Goldrick,M.(印刷中)。 语音处理:语音产生中单词形式信息的检索和编码。在M. Goldrick,V。Ferreira中,& M. Miozzo (Eds.) 牛津语言制作手册。牛津:牛津大学出版社。
Hickok,G.(2014a)。语音产生的体系结构以及音素在语音处理中的作用。 语言,认知与神经科学29,2-20。
Hickok,G.(2014b)。致力于语音生成的综合语言,神经语言,感觉运动框架。 语言,认知与神经科学29,52-59。
胡贝尔(Hubel),&Wiesel,T.N。(1962)。猫的视觉皮层中的感受野,双眼相互作用和功能结构。 生理学杂志,160(1),106-154。
B.Rapp,A.Buchwald,&Goldrick,M.(2014年)。整合言语表达:魔鬼在表象细节中。 语言,认知和神经科学,29,24-27。
Sevald,C.A.,Dell,G.S。,&Cole,J.S。(1995)。语音产生中的音节结构:音节是大块还是图式? 记忆与语言杂志34807-820。
Shattuck-Hufnagel,S。(1992)。单词结构在分段序列排序中的作用。 认识42213-259。
特赖斯曼&Schmidt,H.(1982)。虚构的连词在物体的感知中。 认知心理学,14,107-141。

伍登(Vousden,J.I.),布朗(G.D.)& Harley, T. A. (2000). Serial control of phonology in speech production: A 等级制 model. 认知心理学,41,101-175。

2条评论:

格雷格希科克说过...

嗨,马特和亚当,
非常感谢您的帖子。您提出了一个很好的观点,我不会对此表示怀疑。关于HSFC,我不得不说我的概念化"hierarchical"不是很技术。我真正要强调的是,大脑中至少有两个级别的控制电路参与语音产生,一个由听觉运动循环驱动,并且(能够)对较大的块(例如音节)进行编码,而另一个则由躯体驱动-motor循环,用于编码较小的信息块。我认为您声称音节和节段是独立但相关的主张完全符合我的功能神经解剖学观点。我当然不是要暗示一个视图,其中音节代码是由段构成的,就像您提供的示例中的简单单元格中的复杂单元格一样。因此,我认为我们在这一点上是完全一致的,并且感谢您的澄清。它'重要的一点。有趣的是,看看我们是否能准确确定音节帧如何进行神经编码并与段大小的编码相关。

现在,我们可能会不同意,(更多)讨论会很有趣,那就是段大小单元在语音识别中是否起作用。

马特·戈德里克(Matt Goldrick)说过...

谢谢,格雷格!也许将讨论范围扩大到各部分以外,考虑一下'识别和生产过程中的代表性(或处理)均等。心理语言学的默认假设是“是”,但是'我不清楚在概念上什么是正确的(更不用说'凭经验有效)。