为什么人类语言不用0和1的二进制代码？

美媒《科学日报》2月20日登出一篇文章，探讨为何人类语言不用0和1的二进制代码，而是用那么多字，明明那么复杂。德国语言学家迈克尔·哈恩跟美国加州大学欧文分校的理查德·富特雷尔一起搞了个模型，发现这事儿其实有原因。他们的研究成果最近发在国际期刊《自然·人类行为》上。咱们现在用的语言大概有7000种，有的说的人很少，像汉语、英语这些用的人多得惊人。咱们说话都是把一个个词连起来，组成句子，大家都懂这是啥意思。哈恩觉得，按道理说，要是把语音全变成0和1那种二进制序列肯定更节省资源。毕竟数字能把信息挤得更紧嘛。可问题是，大脑处理起这种纯代码来反而累得慌。因为大脑平时跟世界打交道习惯了这种说话方式，一听就明白。要是让它去解那些干巴巴的数字密码，它就得费劲想很多东西，就像开车走条陌生路一样让人累。哈恩打了个比方：平时上班开车回家那条路特别熟，大脑都知道接下来会看到啥路况，根本不用太操心。要是非要走条虽然近但完全没走过的新路，就得时时刻刻盯着路看才行。人类语言就跟这条路一样走熟了。因为我们从生下来就在讲母语，这些模式早就刻在脑子里了。富特雷尔和哈恩用数学证明了这一点：咱们说话更看重怎么省脑子才方便沟通。这次的发现也能帮着咱们改进现在的AI大语言模型。要是AI能学会人类这种省心的交流方式，那设计出来的系统肯定更聪明。