AI大模型DeepSeek在3月29日深夜出现了一次严重故障,服务器压力骤增导致系统崩溃,App和网页端都无法正常使用。用户输入问题后收到的只是“服务器繁忙,请稍后再试”的提示,类似的问题一直持续到第二天上午9点。这个消息迅速引发了公众的关注,相关话题阅读量很快突破了数亿次。网友们纷纷猜测,这次故障是因为用户量太大,导致服务器负载过载。根据官方状态页的记录,从00:20到02:16,页面被刷新了四次,每次刷新后的文字提示都不一样。这似乎表明,DeepSeek团队正在尽力处理这个问题。然而,直到发稿时,DeepSeek方面仍然没有发布正式的故障说明。 有人表示,这次故障是因为公众需求量实在太大。当大量用户同时涌入时,访问峰值瞬间击穿了服务器承载能力。维护团队试图紧急扩容以应对这个问题,但外部流量却呈指数级放大,形成了恶性循环。结果导致了“越修越堵”的尴尬局面。DeepSeek的这次崩溃对于依赖模型生成内容(MGC)的人来说影响很大。创业者、学生和自媒体作者可能会因此丢失数据、延误排期甚至流失读者。同时,这个事件也暴露出平台在高并发情况下的脆弱性。 业内人士指出,类似的事件并不少见。当AI工具变得流行起来时,“爆款”往往意味着高风险和高并发。为了确保大模型服务的稳定性,公司需要提前预判流量洪峰、设计弹性伸缩的架构以及进行降级处理。这并不是技术单点问题,而是涉及产品、运营、运维和安全等多个部门协同的课题。DeepSeek的短暂瘫痪给所有大模型服务提供了一个教训:如何在需求与稳定之间找到最优解?