为什么人类语言不是二进制

那天我看到一篇文章，说科学家发现人类说话为啥不用简单的0和1，美国《科学日报》在2月20日发了篇报道，讨论这个话题。题目是“为什么人类语言不是二进制”。文章指出，虽然计算机用二进制代码很紧凑、高效，但人类语言显得混乱、低效，可大脑其实更习惯这种表达方式。德国语言学家迈克尔·哈恩和美国加州大学欧文分校的理查德·富特雷尔合作建立了一个模型，解释人类语言为什么长成这个样子。最近他们把成果发到了《自然·人类行为》期刊上。哈恩说，地球上还有大概7000种语言在使用，有些很少人说，像汉语、英语、西班牙语这些大语种却有几十亿人在用。语言把词汇组合成短语，再排句子来传递信息。虽然效率不如二进制代码，可大脑处理起来压力小。这是因为大脑会持续地与已知世界互动。哈恩用上班通勤打比方说：“我们熟悉上下班的路，开车就像自动驾驶一样轻松。大脑早就知道接下来会发生什么事了。如果选一条短但陌生的路开车就累人了，因为要更集中注意力。” 换句话说，人类语言虽然没有最大限度压缩信息，却让大脑承受更小压力。哈恩和富特雷尔用数学证明了这些模式。他们的研究表明，人类语言更看重减少认知负担而不是压缩效率最大化。这些见解也可能给AI大语言模型提供改进的方向。王会聪翻译的这篇文章还提到，通过更好地理解大脑怎么处理语言，研究人员可以设计出更符合自然交流模式的AI系统。