「QuantaMagazine」首次实现:AI模型语言分析能力媲美人类专家

- 文章整理自QuantaMagazine的文章In a First, AI Models Analyze Language As Well As a Human Expert
- 原文作者:Steve Nadis
- 提示词来自于向阳乔木
独家能力?当AI开始“思考”语言本身
最近有没有被ChatGPT这些大模型(LLMs)惊艳到?它们说话越来越像人,用词、逻辑,常常让你分不清对面是人还是机器。
但是,一个很关键的问题来了:AI真的理解语言吗?还是只是个高级的“模仿大师”?
长久以来,语言都被看作是人类最独特的“超能力”。从古希腊的亚里士多德,到现代语言学大神乔姆斯基,都认为人类之所以是人类,关键就在于我们拥有语言。
🤔 乔姆斯基的“泼冷水”:大数据喂不出“理解力”
乔姆斯基和他的伙伴们对大模型的看法一直很“硬核”,简单来说就是:
🤖 “你” AI模型再牛,也只是在大数据里“泡”出来的。它们能熟练地使用语言,但没办法像人类一样分析和推理语言背后的复杂结构。
这就好比一个超级会唱歌的鹦鹉,它能模仿所有曲调,但它不懂乐理,不知道和弦是怎么组织的。
你觉得呢?大模型真的只是“下一词预测器”吗?它们只是在做高级的填空题?
💡 伯克利的新发现:AI也学会了“当语言学家”
最近,伯克利的一群语言学家(Gašper Beguš和他的同事们)不服气,决定给大模型来一场 “语言学研究生”级别的考试。
为什么这个测试很重要?
因为大模型都是吃了海量数据长大的,为了防止它们作弊(直接“背”出答案),研究人员必须设计它们从没见过的语言材料。
这个测试主要有几个大项目,都超硬核:
1. 递归(Recursion):语言的“无限魔力”
递归,简单说,就是一个结构可以嵌在另一个结构里,没完没了。
比如,一句简单的“天空是蓝色的”,你可以不断嵌套:
简说天空是蓝色的。
玛丽想知道山姆是否知道简说天空是蓝色的。
乔姆斯基认为,这种无限嵌套的能力,正是人类语言可以从有限的词汇和规则中生成无限数量句子的关键,也是人类心智的独特标志。
而在所有递归类型中,最难的是中心嵌入(center embedding),比如:“The cat the dog bit died.” (被狗咬的猫死了)。
结果,在分析这种复杂句子的语法结构时,一个名叫o1的大模型表现惊人。它不仅能正确“拆解”句子,还能像专业语言学家一样,用树形图画出句子的结构。
它甚至能更进一步,给一个句子增加一层递归嵌套!
2. 歧义识别:分清“鸡肉”还是“宠物鸡”
你看下面这句话:
“Rowan fed his pet chicken.”
这句话有歧义:
A:罗文喂养了他的宠物鸡(他把食物喂给了这只宠物)。
B:罗文把鸡肉(作为食物)喂给了他的宠物(比如一条狗)。
对于人类来说,结合常识很容易判断。但对电脑来说,这“难于上青天”。因为计算机缺乏那种“常识知识”。
让人惊讶的是,o1模型正确地画出了两种不同的语法树,分别对应这两种解读!它捕捉到了语言中微妙的、需要理解常识才能解决的歧义。
3. 语音学推理:发明新“方言”让AI推理规则
研究员们更绝,他们现场发明了30种“迷你新语言”,每种只有40个你从未听过的“假词”。
然后,他们要求大模型推导出这些新语言的语音规则——比如,什么情况下,一个元音会变成“气声元音”。
结果,o1成功推理出了一条复杂的规则:“当一个元音紧跟在一个‘浊音且阻塞发音’的辅音之后时,它会变成气声元音。”
🤯 “元语言”能力:AI不仅在用,它还在“思考”
这个研究最“炸裂”的地方在于,它证明了大模型有超出预期的“元语言能力”(metalinguistic capacity)。
什么是“元语言能力”?
它不仅仅是会“用”语言,而是能“思考”语言本身。能分析语法、结构、声音模式,就像一个专业的语言学家。
这简直是直接打脸了那些认为“大模型只是在预测下一个词”的说法!它看起来更像是真的在进行深度的语言分析和推理。
❓ 那人类还独特吗?为什么这很重要?
你可能会问,既然AI也能做这些,那我们人类的语言能力还独特吗?
这个研究的结果,可以说是在不断“蚕食”那些曾被认为是人类独有的语言特性。研究者Beguš说得很有趣:“我们似乎没有以前想象的那么独特。”
但是,目前为止,所有的大模型:
没有提出任何原创性的语言学理论。
没有告诉我们任何关于语言的新知识。
它们的能力依然建立在“给定历史,预测下一个token(词或符号)”这个基本机制上。
这为什么重要?
对技术界: 这指明了AI的发展方向。如果只是增加算力和数据,大模型在语言分析上很可能最终会超越人类。
对语言学界: 它迫使我们重新思考“理解”的定义。如果一个机器能完成顶尖人类语言学家的工作,我们还能说它没有“理解”吗?
对“你”我: 这关系到我们对自身认知的边界。当AI开始掌握我们心智中最核心的“工具”——语言时,我们必须更迫切地去理解AI的能力范围和局限性。
你认为,是哪些 “非语言” 的特质(比如意识、感受、创造力),会最终让人类与AI区分开来?