今天,我们聊聊AI洗车这事儿。大家肯定都碰到过这事儿,明明洗车店就在50米开外,结果AI却建议你走路过去。这么个小事,居然难倒了包括ChatGPT、DeepSeek、元宝、Sonnet还有谷歌地图在内的好几个大模型。 说实话,这事儿让人觉得挺无语。本来AI多强大啊,啥都懂,连奥赛难题都能解,可到了这一步却犯了个低级错误。其实道理很简单,就算路近,不开车过去车也洗不了啊。但那些AI怎么想的呢?它们一本正经地分析说开车还要掉头找车位浪费时间。 这就提醒咱们得重新审视AI的现状。一方面它们确实很强,把人类大部分知识都掌握了;另一方面呢,在一些看起来不难的问题上又显得有点笨拙。西湖大学的张岳教授就分析了原因,说现在的大模型还是靠大量数据训练来预测下一个词的模式。虽然模型和数据越来越大,但这种基于统计的AI不太按人类的逻辑走。 张岳教授还举了个例子。就拿翻译来说吧,机器翻译有时候死板但不容易出错,而人类翻译容易出错是因为会联想更多。比如小说里男女主角对话时飘过一抹绿色裙摆,读者马上就能意识到有人在场了,但AI却把它当成女主角在动。这就说明现阶段AI还没法完全读懂“话外音”,所以会出错。 不过话说回来,如果咱们在提问的时候稍微把情况说清楚一点,比如加上“我要洗车但车停在家里”,问题就解决了。但是这也引出了另一个问题:通过模型优化能彻底解决这些失误吗?张岳认为不太可能100%保证不犯低级错误。毕竟大模型的工作原理决定了这一点。 不过值得一提的是在众多模型中,蚂蚁灵光的回答挺不错。它直接说开车去是“唯一明智的选择”,因为车需要清洗。当然了,咱们也不能光看这一件事就给所有AI下定论。 有些模型也在反思自己的失误。像元宝就提到自己有时候会卡在字面意思上忽略了“意图”和“行动”的关联。它也给出了建议:既然AI接收到的是指令而不是意图,那么提问时最好把场景和目标都带上。