2010年6月25日,星期五

学习阅读如何影响言语感知?

叹息...这取决于您所说的“语音感知”(仍然)。

我只是非常期待地阅读Pattamadilok等人在本期《神经科学杂志》上发表的一篇论文。标题为“学习阅读如何影响言语感知?”我真的很兴奋,因为正如我之前指出的那样,有证据表明执行某些“语音感知”任务(例如音节辨别/识别)的能力似乎取决于阅读能力。假设不识字的人仍然能够理解口语(毕竟我们已经做了数十万年),这样的发现似乎表明这些“语音感知”任务并没有真正衡量语音感知,因为它是正常情况下使用的语言。语言处理。

我原本希望这篇新论文能讲到这一点,但相反,尽管作者似乎对这些任务问题很敏感,但该报告在消除语音感知和“语音处理”方面的困惑比清除问题要更多。 。与一般领域一致,Pattamadilok等。报告使用了一系列术语(并非总是定义),读者可能会用这些术语来表示同一事物(语音感知,语音处理,语音表示,语音处理,语音发音模式),并且它们采用或引用了一系列任务(词汇决策,韵律判断,语音意识)在人类语音感知系统不断发展的过程中,可能都没有执行过。

为什么这是个问题? (不用担心,我会在一分钟内进行实际研究。)因为标题使用的是“语音感知”一词,在大多数情况下,这意味着所报告的研究实质上是关于我们感知语音的能力,从而使我们能够理解口语(它在进化上的相关功能),以及如何学习阅读会影响这种基本的感知功能。但是本文没有从这个更基本的意义上评估语音感知,而是评估了确定一个声音序列是否是一个单词的能力,以及决定两个单词是否押韵的能力。此外,由于以这种方式有效地操作了“语音感知”,因此他们最终评估了尚未参与更基本的语音感知功能的大脑区域。因此标题令人误解。应该是,学习阅读如何影响确定一个声音序列是否是单词的能力?

那么他们做了什么?简而言之,他们使用TMS来定位正字法一致性影响的大脑区域:当单词的语气只有一种可能的拼写时,听众可以更快地将听觉呈现的单词判断为单词(听觉词汇决定)( 必须 ),而单词的字rim有很多拼写( 打破 ),即单词的拼写会影响口语单词的“处理”(可操作为词法决定)。他们发现刺激上颌回,“一个参与语音处理的区域”(第8435页,注意未使用语音感知这一术语),取消了正字法一致性效应,而对腹侧枕叶皮质的正字法区域进行了刺激。没有取消效果。

他们得出结论,“……这些发现提供了有力的证据,说明语音感知中的“正字法”影响是在语音学而非正字法层面上出现的。” (第8441页)。

除了术语方面的问题外,我的研究存在的主要问题是,在预测试TMS研究中SMG目标区域在功能上被定义为当受到刺激时会导致视觉上呈现的单词对的韵律判断不足的区域。押韵判断(以及类似的语音意识任务)正是与阅读发展相关的一种能力。因此,基本上,他们所做的就是选择与阅读技能有关的领域,并表明他们参与了与阅读相关的另一项效果。这使我震惊。

Pattamadilok等人指出,SMG不是标准识别的语音感知网络(即STG)的一部分,最终通过其与发音系统和语音STM的链接来解释其在“语音处理”中的作用。可能是正确的:“我们假设PMv-SMG电路在表示和处理有助于“语音处理”的语音发音模式的表示中起着不可或缺的作用。”(第8441页)[他们的引述,再次请注意,它们没有使用术语“语音感知”]。如果说“语音处理”是指他们有能力做出词汇决定,那么我不会不同意,我只是希望他们将其放在标题中。

Pattamadilok C,Knierim IN,Kawabata Duncan KJ和Devlin JT(2010)。学习阅读如何影响言语感知? 神经科学杂志:神经科学学会官方杂志,第30期 (25),8435-44 PMID: 20573891

2010年6月24日,星期四

第二届年度语言神经生物学会议初步方案(NLC 2010)

亲爱的同事,

我们很高兴地宣布,第二届年度语言神经生物学会议(NLC 2010)的初步计划现已推出 线上 !访问我们的网站以下载副本。

今年的会议将有海报和幻灯片演示以及Daniel Margoliash(美国芝加哥大学)和Karl Deisseroth(美国斯坦福大学)的主题演讲。会议还将包括两个关于语言神经生物学领域有争议主题的小组讨论。第一个小组将重点讨论美国国家心理健康研究所的Alex Martin和英国剑桥大学的Karalyn Patterson进行的语义记忆组织和功能讲座。其他小组讨论将集中讨论视觉单词形式区域的作用以及由Cathy Price(英国伦敦大学学院NeuroImaging信托部)和Stanislas Dehaene(法国Collègede,法国INSERM-CEA认知神经影像学部门)进行的专题讲座。 )。

提醒您,提前注册将于7月30日截止!有关更多信息,请访问网站: www.neurolang.org


真诚的

Pascale Tremblay博士,芝加哥大学博士后
史蒂芬·L·斯莫尔(Steven L.Small)博士,医学博士,芝加哥大学教授


语言规划小组的神经生物学:
美国南加州大学Michael Arbib博士
美国威斯康星医学院医学博士Jeffrey Binder
Vincent L. Gracco博士,加拿大麦吉尔大学
Yosef Grodzinsky博士,加拿大麦吉尔大学
美国宾夕法尼亚大学医学博士,医学博士Murray Grossman
彼得·哈戈特(Peter Hagoort),荷兰马克斯·普朗克研究所博士
Gregory Hickok博士,美国加利福尼亚大学欧文分校
Marta Kutas博士,美国加利福尼亚大学圣地亚哥分校
Alec Marantz博士,美国纽约大学
Howard Nusbaum博士,美国芝加哥大学
凯茜·普莱斯(Cathy Price)博士,英国伦敦大学学院
戴维·波佩尔,美国纽约大学博士
Riitta Salmelin博士,芬兰阿尔托大学
酒井邦志博士,日本东京大学
史蒂芬·L·斯莫尔(Steven L.Small)博士,美国芝加哥大学
Sharon Thompson-Schill博士,美国宾夕法尼亚大学
Pascale Tremblay博士,美国芝加哥大学
理查德·怀斯(Richard Wise)博士,帝国理工学院,英国伦敦
凯特·沃特金斯(Kate Watkins)博士,英国牛津大学

2010年6月15日,星期二

博士后/博士职位:莱比锡Obleser实验室

从2011年1月起在马克斯·普朗克人类认知与脑科学研究所(MPI)担任多个职位–CBS)在莱比锡。广告是 这里 .

2010年6月14日,星期一

语言学研究中的定量标准很弱?吉布森/费多连科和斯普劳斯/阿尔梅达之间的辩论

以下是一个角落的Ted Gibson和Evelina Fedorenko以及另一个角落的Jon Sprouse和Diogo Almeida之间有关语言数据性质的交流。交流是由(i) Gibson和Fedorenko TICS论文 和(ii) Jon Sprouse和Diogo Almeida未发表的回应 到那张纸。 大卫 提供了关于该问题的预览评论 这里 。下面的交换通过电子邮件进行了几天。那些参与其中的人允许我将其发布在这里。我删除了以前包含该辩论内容的单独文章。再过几天,我将发布民意测验,以了解人们的想法。请享用...

TED:
您注意到,来自语言学/语法文献的一种特殊比较比来自心理语言学文献的一种特殊比较提供了更强的效果(Gibson&Thomas,1999)。从这个观察中可以得出结论,语言学家感兴趣的影响大于心理语言学家感兴趣的影响。

这是谬论。您从两个文献中的每个样本中抽取了一个示例,并得出结论,这些文献对不同的效应大小感兴趣。您需要从每个样本中随机抽取大量样本来得出结论。

请注意,这是一种重言式,表明您可以找到两个具有不同效果大小的比较:仅凭它自己并没有演示任何内容。通过选择不同的比较,我可以向您展示相反的效果大小比较。例如:

“语法”比较:2wh与3wh,其中2wh通常被认为比3wh差。

1. a。 2wh:Peter试图记住谁携带了什么。
3wh:b。彼得试图记住谁在什么时候携带。

一般认为,“心理语言学”的中心嵌入比右分支要差:
2. a。中心嵌入:新卡目录使很多困惑的研究生正在图书馆学习的古老手稿缺少一页。
右分支:b。新的卡片目录使正在研究图书馆中遗失一页的古老手稿的许多研究生感到困惑。

显然,(2)中的比较中的效果大小将比(1)中的大得多。我认为我们不想像您在论文中得出相反的结论。

实际上,3wh与2wh的比较(一个“语法”问题)的影响很小,甚至无法测量(这是Clifton等人(2006年)和Fedorenko&Gibson(2010年)的观点)。这与语法文献中的假设相反(这是我们的TiCS字母的实际意义)。



乔恩:
嗨,特德,

感谢您的评论。有趣的是,您的评论同样适用于您自己的TiCS信函及其所刊登的较长的手稿。我敢肯定,还有一种更外交的方式来做到这一点,但是为了简洁起见,我将用你自己的话来说明这一点:

您注意到,在调查实验中,很难从天真的受试者那里复制出语言学/语法文献中的一个特殊比较。从这一观察中,您可以得出结论,语言学家报告的影响是可疑的,并且由此产生的理论是不正确的。

This is fallacious reasoning. You sampled one example from a paper that has 70-odd data points in it (Kayne 1983), and a literature that has thousands, and concluded that this one 复制 failure means the literature is suspect. You need to do a large random sample from the literature to make the conclusion that you make.

Note that it is a tautology to show that you can find 复制 failures: this on its own doesn't demonstrate anything. I can show you many such 复制 failures in all domains of cognitive science. These are never interpreted as a death-knell for a theory or a methodology, so why is this one 复制 failure such a big problem for linguistic theory and linguistic methodology.

为了记录起见,我们来信的重点是建设性的-我们正试图弄清楚您可以从单个复制失败中索赔这么多钱,尤其是考虑到一些研究人员报告说在定量实验中运行了数百个结构(例如Sam Featherston,Colin Phillips)证实了语言学家的非正式判断。我并不在乎这两个文献的效应大小是否总是不同(实际上,确定效应重要性的是理论而非效应大小)。我关心的是您的主张,即单个复制失败比我们发现的数百个(无法发布!)复制更为重要。语言学家是认真的人,我们认真对待这些经验问题……但是我们还没有发现任何证据表明语言数据存在严重问题。

我的猜测是,您像本邮件中的许多人一样,认为语言理论面临一些挑战,尤其是如何将其与实时处理理论集成在一起。不幸的是,这些问题不是坏数据的结果(这很容易解决)。问题在于科学很难:复杂的表示理论很难与实时处理理论相集成,而这不能通过将数字附加到判断上来解决。

-乔恩


TED和EV:
[Sprouse quote:]"This is fallacious reasoning. You sampled one example from a paper that has 70-odd data points in it (Kayne 1983), and a literature that has thousands, and concluded that this one 复制 failure means the literature is suspect. You need to do a large random sample from the literature to make the conclusion that you make.

Note that it is a tautology to show that you can find 复制 failures: this on its own doesn't demonstrate anything. I can show you many such 复制 failures in all domains of cognitive science. These are never interpreted as a death-knell for a theory or a methodology, so why is this one 复制 failure such a big problem for linguistic theory and linguistic methodology."[End Sprouse quote]


We think it is misleading to refer to quantitative evaluations of claims from the syntax literature as "复制s" or "复制 failures". A 复制 presupposes the existence of a prior quantitative evaluation (an experiment, a corpus result, etc., i.e. data evaluating the theoretical claim). The claims from the syntax/semantics literature have mostly not been evaluated in a rigorous way. So it's misleading to talk about a "复制 failure" when there was only an observation to start with.

在TiCS信函和另一篇较长的论文中提到的情况(“语法中的定量方法的需要”,目前正在另一本期刊上提交;有修订版) 这里 ,已经执行的定量实验不支持原始论文中要求保护的模式。令人担忧的是,文献中可能还有更多这样的案例,这使得解释理论主张变得困难。

其次,我们没有找到一个例子。我们已经记录了一些,大多数是其他人观察到的。请参阅我们的较长论文。我们相信还有更多。

无论如何,我们不认为文献中的全部或大多数判断都是错误的。假设90%的判断是正确的或正确的。问题在于知道要建立哪个理论的90%。如果一篇论文中有70个相关示例(如Sprouse建议的示例论文),则意味着大约63个正确。但是哪个63? 70选63就是12亿。有很多潜在的不同理论。严格来说,为什么不做实验?正如我们在较长的文章中观察到的,随着Amazon的Mechanical Turk的到来,再也不用做实验了,尤其是英语。 (此外,许多新的大型语料库现在可用–来自不同的语言–可用于评估有关语法和语义的假设。)

[Sprouse quote:]"What I do care about is your claim that a single 复制 failure is more important than the hundreds of (unpublishable!) 复制s that we've found. Linguists are serious people, and we take these empirical questions seriously... but we haven't found any evidence of a serious problem with linguistic data."


除了使用该术语的问题“replication”在这种情况下(如上所述),我们在评估语法/语义学文献中的权利要求方面的经验与Sprouse的经验不同。当我们进行定量实验以评估语法/语义学文献中的主张时,通常不会确切找到最初提出主张的研究人员的判断模式。实验结果几乎总是更加微妙,因此我们从定量实验中获得了很多信息(例如,不同比较中的效应大小,不同结构的相对模式,总体变异性等)。

[我的猜测是,您像我们在本电子邮件中的许多人一样,认为语言理论面临着一些挑战,尤其是如何将其与实时处理理论相集成。不幸的是,这些问题并非问题是数据不好(这很容易解决),问题在于科学很难:复杂的表示理论很难与实时处理理论集成,并且不能通过将数字附加到判断上来解决。 ”


我们从未声称进行定量实验会解决每个有趣的语言问题。但是我们确实认为这是一个先决条件,并且进行定量实验将解决一些问题。因此,我们认为这些领域的严谨性不会受到负面影响。

非常遗憾的是,

泰德·吉布森(Ted Gibson)和埃夫·费多连科(Ev Fedorenko)


DIOGO:
嗨,泰德,嗨,EV(和大家好)

感谢您对我们未发表的信函的评论,并感谢我们指出您正在审核的较长文章。

乔恩已经谈到了我要提出的大多数问题。但是,对于您对上一封电子邮件的一些评论,我还是要在此提出至少一个重要观点,这些评论也写在您的TICS信函和您提供给我们的更长的手稿中。就是说,我认为您在说诸如此类的话时会严重误解语言学家的工作方式:

“在这些领域中,流行的方法涉及评估一个句子/意思对,通常是仅由论文作者进行的可接受性判断,可能还需要非正式的同事调查。” (来自TICS信函)

“ ...语法研究,通常只有一个实验性试验。” (摘自第7页)

"The claims from the syntax/semantics literature have mostly not been evaluated in a rigorous way. So it's misleading to talk about a "复制 failure" when there was only an observation to start with." (from last e-mail)


没有东西会离事实很远。仅仅因为语言学家不定期进行正式的可接受性判断,就声称语言学家的方法学标准低于其他认知科学家,这完全是不准确的。语言学家以与其他科学家完全相同的方式测试他们的理论:通过进行实验,他们(a)仔细构造相关材料,(b)收集和检查所得数据,(c)寻求系统的复制,并且(d)陈述结果受到同行的审查。能够进行推论性统计数据,而不是经过深思熟虑地评估理论所得到的结果,以及系统地研究依赖于它们的数据(对于语言学而言,是通过反复进行的单学科非正式实验来进行的,因此没有“额外”的严谨性)扬声器可以运行)。

语言学家评估两种(或多种)句子类型之间的对比时,通常会在脑海中运行几个不同的例子,寻找潜在的困惑,并咨询其他同事(有时是天真的参与者),他们以相同的方式评估句子类型。整个过程(也称为实验)是非正式进行的,这并不意味着没有认真,系统地进行。我不能足够强调:以下概念:(a)语言学家通常一次只用一对特定的标记来测试他们的理论,(b)根据对单个数据点的评估开始发表论文,并且(c)该单个主题/令牌实验的结果没有受到其他语言学家的认真或系统的审查,完全没有现实依据(例如,请参阅Marantz 2005和Culicover和Jackendoff对您的TICS信函的回复)。

语言学家和其他科学家之间的唯一区别是,为了评估他们的实验(也是实验)的内部有效性,语言学家倾向于不依赖于推论统计方法。造成这种情况的可能原因之一是,语言学家通常看的是相当大的对比,在这种情况下,无需花费很多尝试就能对自己的直觉充满信心。顺便说一句,在这些情况下,统计数据也不需要花费大量的尝试:如果语言学家进行了符号测试,那么所有5个都朝着同一方向进行的试验就已经可以保证在.05水平上具有统计学上的显着结果(语言学家通常会评估令牌更多,顺便说一句)。

但是,在假设的对比不那么明显的情况下会发生什么呢?在这些情况下,语言学家会在遇到不确定的结果时做任何科学家要做的事情:他们将尝试复制非正式实验(例如,通过要求同事/天真的受试者评估相关类型的对比实例),或寻求其他方式测试同一问题(例如,通过进行正式的可接受性判断调查)。可以理解的是,为什么语言学家在历史上倾向于采用第一种方法:复制非正式实验更快,更便宜,而系统复制(科学实验的黄金标准)为结果的外部有效性提供了基础。

真诚的
迪奥戈

ps: I also think you are overstating the case that formal acceptability judgment experiments routinely reach different conclusions from established contrasts in the linguistic literature and you are overinterpreting the implications of the handful of 复制 failures that you cited. I won't go into detail 这里 in the interest of brevity, but I would be happy to share my thoughts in a future e-mail if you are interested.


TED:
亲爱的Diogo:

感谢您对我之前的电子邮件的周到答复。让我跳到重点:

你说:
Linguists test their theories in the exact same way other scientists do: By running experiments for which they (a) carefully construct relevant materials, (b) collect and examine the resulting data, (c) seek systematic 复制 and (d) present the results to the scrutiny of their peers. There is no "extra" rigour that comes from being able to run inferential statistics beyond what you get from thoughtfully evaluating theories, and systematically investigating the data that bear upon them (in the case of linguistics, through repeated single subject informal experiments that any native speaker can run).

...整个程序集(也称为实验)是非正式进行的,这并不意味着它没有经过仔细而系统地进行。


很抱歉这么钝,但这是不正确的。 *(a)构造了针对目标现象的多个示例,这些示例更为严格,这些示例针对有害因素进行了规范; (b)在天真的实验人群中评估材料。

这两点都很重要,但第二点是我发现许多语言研究人员都低估了这一点。无法在幼稚的人群(带有干扰因素的材料等)上评估假设的问题是,研究人员及其朋友存在无意识的认知偏见,使得他们对这些材料的判断接近于一文不值。 (这听起来很刺耳,但不幸的是,这是事实。)我是第一手知道的。当我们在 更长的纸 (请参阅第16-20页),如果您阅读了我的博士学位论文,很多情况下的判断结果是不正确的,这可能是由于我和我所问的人们的认知偏见。我们从论文中得出了这样一个错误判断的例子:有人认为,当嵌套修饰的相对从句结构修改主语(2)时,理解它们比修改对象(3)时要复杂得多(Gibson,1991,示例(第145-147页的(342b)和(351b)):

(1)狗咬的女人喜欢的男人吃鱼。
(2)我看到了被狗咬的女人喜欢的男人。

也就是说,认为(1)比(2)难处理。在进行这项研究时,我问了很多人,他们都同意了。我构造了各种类似的版本。我问的很多人都一致认为(1)比(2)还差。

但是,如果您对幼稚的对象和大量的填充物等进行实验,那么结果是没有这种效果。我进行了大约5次比较,但从未发现任何差异。两者的评级都不太令人满意(相对于许多其他事物而言),但是这两种结构的预测方向从未存在差异。

这里的问题很可能是认知偏见。我有一个可以预测差异的理论,而我所有的线人都有一个相似的理论(基本上,如Miller&Chomsky(1963)和Chomsky&Miller(1963)所建议的那样,更多的嵌套会导致更困难的处理)。因此,我们使用该理论来获得该理论所预测的判断。

如果您阅读有关认知偏见的文献,这是标准效果。引用我们较长的论文:

“在埃文斯·巴斯顿& Pollard's experiments (1983;cf.其他类型的确认偏差,例如Wason于1960年首次证明;参见尼克森(Nickerson),1998年,对许多相似类型的认知偏差实验的概述,人们被要求判断逻辑论证的可接受性。尽管实验参与者有时能够使用逻辑运算来判断所提出的论点的可接受性,但他们对真实世界中论点的合理性的了解最大,而与论据的合理性无关。因此,他们经常犯下判断错误,因为他们不知不觉地被现实世界中事件的可能性所偏见。

更一般而言,当要求人们判断语言示例或论点的可接受性时,他们似乎无法忽略潜在的相关信息源,例如世界知识或理论假设。例如,理解理论上的假设,即具有更多开放语言依赖性的结构比具有更少开放语言依赖性的结构更复杂,这可能导致实验参与者将具有更多开放依赖性的示例判断为更复杂……”

我们论文的主要观点之一是,仅谨慎和认真思考还远远不够。只是不够严谨,无法避免无意识的认知偏见的影响。为了变得严谨,您确实需要对幼稚主体的分析进行定量评估。语料库分析或对照实验。

你说:
语言学家和其他科学家之间的唯一区别是,为了评估他们的实验(也是实验)的内部有效性,语言学家倾向于不依赖于推论统计方法。造成这种情况的可能原因之一是,语言学家通常看的是相当大的对比,在这种情况下,无需花费很多尝试就能对自己的直觉充满信心。顺便说一句,在这些情况下,统计数据也不需要花费大量的尝试:如果语言学家进行了符号测试,那么所有5个都朝着同一方向进行的试验就已经可以保证在.05水平上具有统计学上的显着结果(语言学家通常会评估令牌更多,顺便说一句)。


我在回应乔恩先前的评论时所表达的观点仍然成立。如果您想声称语言学家倾向于检查的影响大小大于心理语言学家检查的影响大小,那么您需要证明这一点。您不能仅仅陈述它并期望其他人接受您的假设。我个人非常怀疑这是真的。我已经阅读了数百篇语法/语义学论文,并且在大多数论文中,有很多可疑的判断,这可能是效果较小或无效果的比较。

泰德·吉布森


DIOGO和JON:
亲爱的特德,

感谢您的答复。这是乔恩和我的共同答复。

[吉布森语录:]让我跳到正确的位置:“对不起,我很抱歉,但这是不正确的。*(*)*(a)构造了多个目标现象的例子,因此更加严格,这是规范化的令人讨厌的因素;”


我们完全同意需要多个项目。实际上,我们只是告诉您,语言学家通常会评估任何提议的句子类型对比的多个实例。在这一点上,语言学家和心理语言学家之间根本没有区别(参见Marantz 2005)。

我们完全不同意您对幼稚参与者结果分配的优先级。没有特别的理由分配平均人数的30多名大学生作为真理的仲裁者。仅仅发现研究人员认为将要发生的事情与来自一群幼稚受试者的实验结果之间的区别并不是特别有益,特别是如果它们属于“无法复制”类型。有几个原因可能导致意外的空结果与“认知偏见”无关:

(1)实验能力不足

例如,在Gibson和Thomas(1999)中,您声称与最初的动机直觉相反,您没有发现(b)的评分优于(a):

一种。 *新卡目录使研究生困惑的研究生正在图书馆学习的古老手稿缺少一页。

b。新卡目录使研究生感到困惑的研究生的古代手稿缺少一页。

在我们未公开的信中(见图),我们表明这很可能是权力问题,因为肯定存在影响(影响很小,需要大样本才能被检测到)。

(2)实验设计存在问题,例如:

(i)实验使用的任务不一定对操纵敏感

例如,为什么您一定认为可接受性任务应该对所有处理困难都同样敏感?可能的情况是,可接受性判断可能不是使用权利的衡量标准。

(ii)实验使用的设计或任务并非最佳,无法揭示感兴趣的效果

Sprouse&Cunningham(正在审查中,第23页,图8随函附上)的数据表明,使用一个尺寸为Gibson&Thomas(1999)一半大小的样本,可以检测出上述(a)和(b)之间的对比。具有较低可接受性参考语句的幅度估计任务(但在使用较高可接受性参考语句时则根本不执行)。

这些解释都没有引起认知偏见。我们不一定不同意认知偏见是一个潜在的问题。我们只是认为,在您将其用作解释之前,(1)您需要肯定的证据,(2)在正式实验中未能复制非正式实验的结果并不是肯定的证据。实际上,如果您对以前的电子邮件中似乎主张过的天真的参与者分配了形式实验结果的优先级,那么您会被Gibson&Thomas(1999)的数据所误导,并且得出的结论是不是真的。实际上,您自己是通过诉诸测试的离线性质而不是认知偏见来解释结果的,那么为什么认知偏见应该成为语言学的零假设?

此外,我们还可以找到完全相反的模式:明显的实验效果证实了最初的期望,但实验者认为这是反对他们的证据。以Wasow&Arnold(2005)为例。在较长的手稿中,您应这样说:

“寡妇& Arnold (2005) discuss three additional cases: the first having to do with extraction from datives;第二,与习语的句法灵活性有关;第三点与Chomsky(1955/1975)中讨论的某些重磅NP移位项目的可接受性有关。其中第一个似乎与菲利普斯特别相关’要求。在这个错误的判断数据示例中,Filmore(1965)指出像(1)这样的句子在语法上是不符合语法的:

(1)您是谁给这本书的?

兰根多恩(Kalang-Landon)& Dore (1973) tested this hypothesis in two experiments, and found many participants (“at least one-fifth”)完全接受这类句子的语法。 Wasow&Arnold指出,此结果对语法文献影响不大。”(第13-4页)

而且不应该。如果只有Langendoen等人样本的五分之一。 (1973)未能显示出预期的对比,结果根本没有问题。实际上,它们实际上是非常重要的,并且绝大多数都支持原始建议:这里简单的单尾符号测试将为您提供1.752e-09的p值和95%的CI,以便在预测方向(0.7-1))。让我再次强调一下:实验实际上告诉您的是,结果支持了语言学家的非正式实验,而不是像Wasow和Arnold所认为的相反。

Wasow&Arnold(2005)自己的可接受性实验也是如此。他们决定检验乔姆斯基(Chomsky,1955年)对动词质点与宾语NP复杂性相互作用的直觉。他们测试了以下范例,其中(a-b)中的对象被认为比(c-d)中的对象更复杂。

一种。孩子们接受了我们所说的一切。(1.8)
b。孩子们接受了我们所说的一切。 (3.3)
C。孩子们接受了我们的所有指示。(2.8)
d。孩子们听了我们的所有指示。 (3.4)

乔姆斯基认为,(c)听起来比(a)更自然,并且(b)和(d)应该同样可以接受。这正是Wasow&Arnold(2005)发现的结果(请参见上述每种条件旁边的4分制的平均可接受性),并得出了非常显着的结果。这些结果还重复了它们的另一个条件,为简便起见,在此省略。然而,Wasow&Arnold(2005)声称:

“回答的差异很大。特别是,尽管具有复杂NP的拆分示例的平均得分远低于其他任何得分(即,结果支持乔姆斯基的直觉),但对此类句子的回答中有17%是得分3或4。也就是说,大约有六分之一的时间,参与者认为这样的例子并不比尴尬更糟。”

再次,结果是非常有意义的,并支持而不是破坏了语言学家的原始直觉,但是Wasow&Arnold(以及您所引用的文章中的内容也同样如此)似乎与所提供的实验数据相反。

那么,仅通过执行正式的可接受性判断,这种额外的严格性又在哪里呢?在我们看来,仅与天真的参与者一起进行正式的可接受性实验,就不会比一个非正式的实验更能避免一个人被自己的结果所误导。

真诚的
迪奥戈与乔恩


TED和EV:
尊敬的Diogo和Jon:

关键不是*定量证据可以解决语言研究中的所有问题。关键在于,拥有定量数据是必要但非充分条件。就这样。

如果没有定量证据,您将只有研究人员的潜在偏见。我认为那还不够。做一个实验来评估一个人的研究问题不是很困难,所以应该做一个实验。一个是做实验后*永远不会恶化。您可能会发现问题比实验之前想的要复杂和难以解决。但这甚至是有用的信息。

目前,我没有其他要说的了。有一天,如果您愿意,我很乐意在公共论坛上与您辩论。

最良好的祝愿,

特德(&Ev)


DIOGO:
亲爱的特德,

让我在您的上一封电子邮件中添加一些评论,然后我也就此事无话可说了。感谢您参与我们的讨论。

[吉布森引用:]“重点不是*定量证据能够解决语言研究中的所有问题。重点只是拥有定量数据是必要条件,而不是充分条件。仅此而已。”


我和乔恩(Jon)试图指出的一点是,尽管具有潜在的实用性,但不一定总有用于语言学研究的定量数据。您的主张的含义也绝非无争议的:它暗示着语言学在没有广泛使用定量方法的情况下未能达到“必要的”科学标准。我们认为这既是错误的,也是错误的。

[吉布森引述:]“如果没有定量证据,您只会得出研究人员可能有偏见的判断。我认为那还不够好。”


事情就是这样:语言文学中发表的判断对比,尤其是在理论上很重要的对比,已经在非正式实验中复制了数百次。当对比没有争议时,它将继续被很好地复制并且不会引起进一步的关注。但是,当对比有些不稳定时,语言学家会敏锐地意识到这一点,并据此权衡其支持(或拒绝)的理论。最后,当对比不能真正复制时,它实际上是受到挑战的,因为那是语言学家所做的一件事:他们试图检验自己的理论,并且如果该理论的某些部分在经验上是薄弱的,它将受到挑战。我高度怀疑认知偏见在这个系统的复制过程中能否发挥重要作用。

Now, 这里 's where this methodology is potentially problematic: If there is a judgment contrast from a language for which there are very few professional linguists that are also native speakers and for which access to naive native speakers is limited. In this case, it is possible that a published judgment contrast will go unreplicated, and if faulty, could lead to unsound conclusions. In these cases, I totally agree that having quantitative data is probably necessary. But note that the problem 这里 is not the lack of quantitative data to begin with, the problem is with the lack of systematic 复制. Quantitative data only serves as a way around this problem.

[吉布森引述:]“做一个实验来评估一个人的研究问题并不是很难,所以应该做一个实验。”


关键是语言学家在做实验。他们只是非正式地做。

[吉布森语录:]“做完实验后,情况永远不会恶化。您可能会发现问题比做实验前想的要复杂和难于解决。但这甚至是有用的信息。”


问题不在于进行正式实验后是否情况恶化。问题是,一个人是否一定更好。

运行正式实验与非正式实验的成本非常高。与幼稚的参与者进行正式实验需要时间(IRB批准,在校园内做广告,让受试者来实验室进行调查或设置一些Web界面以便他们可以在家中进行操作等),并可能要花钱(如果您不这样做)不能有志愿者主题库,或者如果您使用亚马逊的Mechanical Turk之类的东西)。如果您希望语言学家将这种询问方式作为“必要的”,则必须向他们证明他们这样做会更好。那部分实际上还不清楚他们是否会这样做。

您可以尝试通过两种方式展示这一点:您可以向语言学家展示(1)他们变得有趣,以前没有可用的数据,或者(2)向他们展示他们被非正式数据收集方法误导了,并且运行正式实验确实可以解决问题那。因为否则,有什么意义?如果语言学家一遍又一遍地确认他们在使用幼稚的参与者时仍能获得与使用非正式方法相同的结果(这就是乔恩,萨姆·费瑟斯顿,科林·菲利普斯等语言学家不断告诉您的情况),那么为什么应该他们烦恼要采用一种速度慢得多,成本高得多的方法,该方法没有比他们快速,非正式但可高度复制的方法提供更多的信息?

最良好的祝愿,
迪奥戈

2010年6月11日,星期五

博士后职位– MEG/EEG - PARIS

Applications are invited for a postdoc position supervised by Ghislaine Dehaene-Lambertz to work on consciousness in infants using EEG. The team is part of INSERM’s ‘Cognitive Neuroimaging Unit' (http://www.unicog.org, director : Stanislas Dehaene) 在 NeuroSpin (director : Denis LeBihan) in the greater Paris region. NeuroSpin is a newly opened outstanding interdisciplinary research environment that houses several research laboratories and combines expertise in cognitive neuroscience and neuropsychology, magneto-electrophysiology, high field MR imaging and imaging data analysis.

该项目是欧洲共同体项目的一部分,该项目旨在研究成年人,猴子,婴儿和昏迷患者的意识。博士后将对婴儿的EEG实验(潜意识表现,刺激碰撞等)进行程序设计和分析,并与其他相关小组讨论结果。申请人应具有神经科学,医学,心理学或相关领域的博士学位。

有必要具备EEG / MEG分析技能的经验。薪水将与法国公共研究组织薪金范围内的经验相称(每月约2100欧元)。该职位的经费为一到五年,应于2010年秋季开始。在职位填补之前,将考虑申请。

有关更多信息或提交申请(包括两名裁判的姓名),请联系Ghislaine Dehaene-Lambertz,电子邮件:[email protected]

2010年6月9日,星期三

期刊扫描-2010年6月

一些有趣的文章-

下额回回激活预测耳蜗植入模拟的知觉学习中的个体差异。
弗兰克·埃斯纳(Frank Eisner),卡洛琳·麦基蒂根(Carolyn McGettigan),安德鲁·福克纳(Andrew Faulkner),斯图尔特·罗森(Stuart Rosen)和索菲·斯科特(Sophie K.Scott)
J.神经科学。 2010; 30 7179-7186

中央听觉通路中的驱动器和调节剂
查尔斯·李·李和S·M·谢尔曼
人类神经科学前沿

鱼卵中歌曲感知的机制
Daniel P. Knudsen,Timothy Q. Gentner
大脑与语言

直接记录人类听觉皮层的音高反应
蒂莫西·格里菲斯(Timothy D.
当前生物学

语音时空目标的人类皮层时空动力学。
Edward F. Chang,Erik Edwards,Srikantan S. Nagarajan,Noa Fogelson,Sarang S. Dalal,Ryan T. Canolty,Heidi E. Kirsch,Nicholas M. Barbaro,Robert T. Knight
认知神经科学杂志

2010年6月8日,星期二

Donostia神经双语教学研讨会

我们很高兴地宣布,将在Donostia举行的Donostia神经双语教学研讨会在线注册–圣塞瓦斯蒂安(西班牙)现已营业。

邀请与会者通过以下网站进行注册:www.bcbl.eu/events/neurobilingualism

要记住的重要日期:

-摘要提交截止日期:2010年6月15日
-绝对接受通知:2010年6月30日
-提前截止报名日期:2010年7月15日
-会议日期:2010年9月30日至10月2日

特邀演讲嘉宾

*劳拉·安·佩蒂托(Laura-Ann Petitto)。加拿大多伦多大学
* Agnes Kovacs。匈牙利科学院,匈牙利。
*迈克尔·多曼(Michael Dorman)。美国亚利桑那州立大学。
*乔纳森·格兰杰。 CNRS和法国普罗旺斯大学。
*道格拉斯·戴维森。西班牙BCBL。
* Nuria Sebastian。西班牙庞培法布拉大学。

讨论区

纪尧姆·蒂埃里(Guillaume Thierry)。班戈大学。英国。
* Nuria Sebastian。西班牙庞贝法布拉大学


如果您可以将此信息分发给您认为有兴趣的任何人,将不胜感激。

2010年6月3日,星期四

回到语法和Broca领域的未来

35年前,Caramazza和Zurif(1976)提出了惊人的主张,从字面上改变了人们对Broca失语症,Broca领域和语法神经病的思考方式。直到那个时候,布罗卡的区域基本上被认为是运动语音区域。著名研究人员甚至认为,布罗卡失语症的语法语音输出不反映句法上的缺陷,而是反映由于表达语音的难度而导致的努力的节约。在这种情况下,Caramazza和Zurif表明Broca的失语症无法理解需要句法分析的句子。 (注意:传导失语症也是如此,但没人记得这一事实。)

根据他们的发现,C&Z提出以下主张:

...对于Broca ’在失语症患者中,脑损伤会影响一种通用的语言处理机制,该机制可同时满足理解和产生的句法成分。其后的含义是,大脑的前语言区域对于象句法一样的认知操作是必需的。 (第581页)


最先进的技术,1976年:布罗卡地区是语法的所在地。

当然,这是一个美丽的研究,此后已被重复复制。他们的结论是完全合理的,只是事实证明他们是错误的。随后的工作(例如Linebarger,Schwartz和Saffran,1983年)表明,布罗卡的失语症并没有完全失去其语法-他们仍然可以使语法判断相当不错。

最先进的技术,1983年:Broca的领域不是语法所在地。

这个领域对Broca领域提出了许多新想法:它仅支持语法的受限部分(Grodzinsky),支持语法与含义之间的映射(Schwartz和Saffran),支持快速访问词汇信息(Zurif等) )。

1983年之后的最新技术:谁知道Broca的领域在做什么,但我们都同意:它不是(所有)语法的所在地。

现在快进到今天,回顾一下Broca领域在语法中的作用的文献。您可能会遇到Fadiga等人的论文。 (2009)指出:

我们建议Broca的区域可能是编码分层结构的大脑网络的中心,而不管它们在行动,语言或音乐中的使用。 (第455页)


Friederici及其同事也提出了类似的主张,他们提出了Broca领域在层次结构处理和短语结构构建中的作用。

最新技术[?!],2009年:Broca在任何类型的分层处理中都以其更普遍的作用[?!]成为语法的所在地。

1983年到2009年之间发生了什么,导致回归到有趣但最终是错误的C&Z索赔?功能成像发生了。似乎当功能成像成为一种广泛的工具时,尤其是在1990年代fMRI的发展时,该领域要么忘记了几十年来的出色研究,要么就决定重新开始。这是个错误。

新规则:如果您想声明Broca的区域是语法的所在地,请(i)引用Caramazza&Zurif,以及(ii)为Linebarger等提供解释。结果。

参考文献

Caramazza A,Zurif EB。 1976年。在句子理解中算法和启发式过程的分离:来自失语症的证据。大脑和语言。 3:572-582。

路易斯安那州法迪加(Fadiga),路易斯安那州(Craighero)& D’Ausilio,A.(2009年)。布罗卡语言,动作和音乐领域 纽约科学院院刊,1169年 (1),448-458 DOI: 10.1111 / j.1749-6632.2009.04582.x

弗雷德里奇(Friederici)。 2009。语言的途径:人脑中的纤维束。趋势科恩科学。 13:175-181。

Friederici AD,Bahlmann J,Heim S,Schubotz RI,Anwander A.2006。大脑区分人类和非人类语法:功能定位和结构连接。美国国家科学院院刊103:2458-2463。

Linebarger MC,Schwartz M,Saffran E.,1983年。对所谓的语法无谓语语法结构的敏感性。认识。 13:361-393。

2010年6月1日,星期二

方法主义帝国主义的残酷行为

吉布森(Gibson)在最近出版的《 TICS》(语言学研究中的定量标准薄弱。10.1016/ j.tics.2010.03.005)的“更新”中&费多连科(GF)犯下了方法主义帝国主义的残酷行径,而这是毫无根据的行为。

GF抱怨说,理论语言学(尤其是语法和语义研究),可接受性或语法判断的一个关键数据来源不是“定量的”。他们主张采用某种直观的标准来进行“正确的”定量工作意味着什么,认为“在测试语法/语义学研究问题时,应评估多个项目和多个幼稚的实验参与者,因此需要使用定量的分析方法。”他们认为,“标准语言学方法缺乏有效性,导致文献中许多情况下,可疑的判断导致不正确的概括和不合理的理论化”。 GF以一种特殊的修辞方式继续强调他们的担忧:“这种方法无效的事实带来了不受欢迎的结果,即具有较高方法标准的研究人员经常会忽略语言学领域的当前理论。这具有不良影响。紧密相关领域的研究人员没有意识到语法和语义研究中有趣的假设。”

现在,表达对语法判断的担忧并不是什么新鲜事。为什么在专门研究趋势的期刊中将其视为“更新”有点神秘-该主题已被重新研究了几十年(例如Spencer 1972,Clark 1973,以及随后的许多版本),充其量不过是“过时”。除了两位资深且富有成效的MIT心理语言学家Ted和Evelina对理论语言学表现出敌意之外,尚不清楚该期刊正在主题化什么趋势,除了很平庸的观点之外,不幸的是,在几乎所有研究领域中,不良研究的例子。

但是,是否真的需要告知语言学家存在观察者偏见?那个实验有用吗?语料库分析可以产生更多数据吗?我必须说,我发现学校杂乱的规范主义非常令人反感。像所有学科一样,语言学也依赖复制,汇聚的证据(例如跨语言验证)以及确实能够阐明正在研究的理论建议的任何信息来源。有些理论可以生存并得到完善,而另一些则无效。这与任何其他领域不同吗? GF似乎相信证据和标准的层次结构,并且一些未指定的定量分析感被认为是“更高”和“更好”。他们愿意将这种观点扩展到我们从事神经生物学研究的那些人吗?由于定量和“难”,我的数据是否更好?我认为,这不是我们要为语言的认知神经科学得出的结论。

美食 &Jackendoff发表了回应(解决了部分问题)(仅定量方法还不够:对Gibson和Fedorenko的回应。10.1016/ j.tics.2010.03.012)。他们的语气相当调和,尽管他们正确地指出:“理论家的主观判断对于制定语言理论至关重要。如果要求所有歧义性和语法性的判断都要经过对幼稚主题的统计严格实验,这将会削弱语言学研究,特别是在调查说话者难以访问的语言时。语料库和实验数据在本质上并不优于主观判断。”他们的观点是有说服力的-但这并不是一个积极的回应。他们的评论太过随意了,以及“为什么我们都不能成为朋友?”味道。

另一方面,我只是读了我希望TICS发表的对GF的非常聪明,适当进取和定量的回应。我的理解是TICS有机会查看此回复,而令我困惑的是他们没有发布这一实际上新颖而有见地的评论。它是由加州大学欧文分校(UC Irvine)的Jon Sprouse和Diogo Almeida(SA)(数据则相反。对吉布森和费多连科的回应。)SA分析了来自170多个天真的参与者的数据,并对在语言学和心理语言学中频繁出现的两种现象(wh-islands和中心嵌入)做出了判断。通过定量(重采样)分析,他们可以得出给定此类研究的效果量,需要多少个判断和多少个对比才能获得显着的结果。令人信服的是,它们表明,对于正在研究的那种现象,必须有千差万别的主题和对比才能达到令人信服的结果。语言学家倾向于担心的各种对比和现象在很少的数据点下就很明显了。相比之下,要获得令人满意的心理语言现象的结果,必须使用惊人的大数据集。在我看来,他们得出的结论是非常正确的,唯一可以得出结论的是,语言和心理语言学的研究对象完全不同。可能存在争议,但没有问题...

读者应对此问题发表自己的看法,但我敦促他们研究这三篇简短的评论。


Gibson,E.和Fedorenko,E.(2010)。语言学研究中的定量标准薄弱 认知科学的趋势 DOI: 10.1016 / j.tics.2010.03.005

NLC2010:会议站点宣布,延长摘要提交截止日期

请注意,第二届年度语言神经生物学年度会议的摘要提交将被接受,截止时间为CST的6月4日(星期五)(截止日期!)。有关摘要提交的准则,或要提交摘要,请访问我们的 网站 !

我们很高兴地宣布,第二届年度语言神经生物学会议(NLC 2010)将以美丽的南加州风格举行 兰乔伯纳多牧场高尔夫温泉度假酒店。作为Rancho Bernardo Inn的客人,您将享受完整的度假村式体验:豪华住宿,屡获殊荣的餐厅,锦标赛高尔夫球场,度假村水疗中心等。此外,Rancho Bernardo Inn距圣地亚哥的许多地方仅数分钟路程’的热门景点:野生动物公园,乐高乐园,海洋世界,圣地亚哥动物园和南加州海滩。

为了让您的NLC 2010体验令人难忘,我们非常高兴地为单人或双人入住提供无与伦比的房价,即170美元,为所有在兰乔住宿的与会者提供免费儿童俱乐部,并在星期六免费返回圣地亚哥市中心,11月13日,公布的高尔夫价格可享受30%的折扣(适用于个人或锦标赛比赛,包括租赁车),水疗服务可享受10%的折扣,以及免费自助停车。

整个会议期间(即11月10日至12日)都可以使用团体费率,并且可以在会议之前和之后的3天延长。要在线预订房间,请访问Rancho's 网站 并使用以下代码:1011ANNUA。请注意,在线预订系统仅接受会议日期之内的预订。要以团体价格预定其他日期,请致电牧场’预订团队的周一至周五上午7点至晚上9点,周六和周日上午7点至下午7点在800-542-6096。

由于空间有限,我们强烈建议您尽快在兰乔预订您的房间!