2008年6月16日,星期一

名词含义:科学中有趣但有趣的论文

在5月30日的 科学 有一篇Mitchell等人的论文。带有挑衅性的标题,“预测与名词含义相关的人脑活动。”这是一个很大的希望。我认为本文显示了一种查看fMRI数据的创新方法。我还认为,关于名词的含义,它提出的问题多于其回答的问题。

本文提出了一种计算模型,该模型使用一万亿个单词的文本语料库进行训练,并观察到fMRI数据,然后用于预测新单词的fMRI响应模式。该模型基于以下内容:“首先,它假定区分任意具体名词含义的语义特征反映在非常大的文本语料库中其使用的统计信息中。...其次,假定大脑活动在思考任何具体名词时所观察到的结果,可以从其每个语义特征中得出贡献的加权线性和。

我认为这种计算建模思想确实很酷,但我也对此预设感到困惑。例如,当只是从同现统计中得出“含义”时,我只是不明白“含义”是什么意思。直觉似乎是您可以找到“中间语义特征”,但是当您阅读本文时,那些中间语义特征本身必须在语料库中找到。这里只是将它们提供给模型,但是在世界的共现统计视图上,学习者是否不必实际获得此信息?无论如何,我觉得这很有趣,并且想学更多,但是它确实对意义如何产生做出了特定的假设,这需要更多的解释,至少对于像我这样的人而言。此外,第二个假设,即语义特征的贡献的加权线性和构成了意义,这同样令人困惑。

在这种方法中似乎能很好地捕获的材料类型是具体名词以及具有非常明显的感觉运动特征的动词。确实,作者认为,他们的模型“证实了具体名词的神经表示部分基于感觉运动特征的推测”。好的,所以他们在这里告诉我们一些非常具体的内容,也许与Alex Martin考虑问题的方式一致。但是在那之后,他们说:“看来,构成具体名词的神经表示基础的特征的基础集所涉及的范围远远超过感觉运动皮层区域。”好吧,现在看来他们想吃蛋糕也要吃。谁不呢?

该实验打动了我,这是一种非常新颖的讯问功能磁共振成像数据的方式,但我认为核心问题仍然非常难以解决。 “语义激活的基础特征集和编码具体名词含义的神经激活的对应成分是什么?”

可以说这个理论是完全正确的。也就是说,语料统计+感觉运动功能足以描述具体的名词和动作动词(我认为结论很狡猾)。这是否意味着要将其扩展到意义的其他方面,我们需要一个完全不同的理论?例如,我们将如何处理a)抽象,b)闭类词和c)任何形式的组合性?我确实认为,令人鼓舞的是,硬核计算方法允许我们使用新的“眼镜”来查看这些复杂的数据集。但是我仍然认为,在解释此类挑衅性数据集的背景下,需要非常仔细地研究认知科学部分以及本例中的语义。

我希望格雷格(Greg)或任何读者或评论员都能启发或教我更多有关此有趣的新论文的信息。

1条评论:

匿名 said...

我刚刚听说过此事(以及您的博客)。他们进行了一项相关研究,其中功能磁共振成像机和机器学习算法能够根据大脑中12个最稳定激活的个体体素来“猜测”单词。这非常酷,只是很多体素遍布大脑并且最终并没有对语言本身有太多了解。