为什么人类语言不用0和1的二进制代码?

美媒《科学日报》2月20日登出一篇文章,探讨为何人类语言不用0和1的二进制代码,而是用那么多字,明明那么复杂。德国语言学家迈克尔·哈恩跟美国加州大学欧文分校的理查德·富特雷尔一起搞了个模型,发现这事儿其实有原因。他们的研究成果最近发在国际期刊《自然·人类行为》上。咱们现在用的语言大概有7000种,有的说的人很少,像汉语、英语这些用的人多得惊人。咱们说话都是把一个个词连起来,组成句子,大家都懂这是啥意思。 哈恩觉得,按道理说,要是把语音全变成0和1那种二进制序列肯定更节省资源。毕竟数字能把信息挤得更紧嘛。可问题是,大脑处理起这种纯代码来反而累得慌。因为大脑平时跟世界打交道习惯了这种说话方式,一听就明白。要是让它去解那些干巴巴的数字密码,它就得费劲想很多东西,就像开车走条陌生路一样让人累。 哈恩打了个比方:平时上班开车回家那条路特别熟,大脑都知道接下来会看到啥路况,根本不用太操心。要是非要走条虽然近但完全没走过的新路,就得时时刻刻盯着路看才行。人类语言就跟这条路一样走熟了。因为我们从生下来就在讲母语,这些模式早就刻在脑子里了。 富特雷尔和哈恩用数学证明了这一点:咱们说话更看重怎么省脑子才方便沟通。这次的发现也能帮着咱们改进现在的AI大语言模型。要是AI能学会人类这种省心的交流方式,那设计出来的系统肯定更聪明。