那天我看到一篇文章,说科学家发现人类说话为啥不用简单的0和1,美国《科学日报》在2月20日发了篇报道,讨论这个话题。题目是“为什么人类语言不是二进制”。文章指出,虽然计算机用二进制代码很紧凑、高效,但人类语言显得混乱、低效,可大脑其实更习惯这种表达方式。 德国语言学家迈克尔·哈恩和美国加州大学欧文分校的理查德·富特雷尔合作建立了一个模型,解释人类语言为什么长成这个样子。最近他们把成果发到了《自然·人类行为》期刊上。 哈恩说,地球上还有大概7000种语言在使用,有些很少人说,像汉语、英语、西班牙语这些大语种却有几十亿人在用。语言把词汇组合成短语,再排句子来传递信息。虽然效率不如二进制代码,可大脑处理起来压力小。这是因为大脑会持续地与已知世界互动。 哈恩用上班通勤打比方说:“我们熟悉上下班的路,开车就像自动驾驶一样轻松。大脑早就知道接下来会发生什么事了。如果选一条短但陌生的路开车就累人了,因为要更集中注意力。” 换句话说,人类语言虽然没有最大限度压缩信息,却让大脑承受更小压力。哈恩和富特雷尔用数学证明了这些模式。他们的研究表明,人类语言更看重减少认知负担而不是压缩效率最大化。这些见解也可能给AI大语言模型提供改进的方向。 王会聪翻译的这篇文章还提到,通过更好地理解大脑怎么处理语言,研究人员可以设计出更符合自然交流模式的AI系统。