嘿,听说最近DeepSeek要搞大事了!他们下一代的模型准备把DSA架构给彻底翻修一遍,这次甚至要把MoE技术给加进来,这可是革命性的东西。到了2025年,国产大模型这块儿的竞争可太激烈了,各个厂家都在拼命推出新玩意儿抢市场。中信证券的那份报告说,DeepSeek这次新出的模型肯定还会坚持高性价比的路子,核心能力肯定是要大升级的。咱们就来聊聊这个深不见底的技术未来。 先说DeepSeek V4.0吧。2026年1月推出的V3.2已经用上了DSA和MoE组合拳,训练速度和计算效率都飞升了,而且token价格还降下来了。那V4.0肯定更厉害!他们要把Engram模块给整合进来,这个梁文峰搞得玩意儿可太玄乎了。它能把常用的关键信息分层存起来,把Transformer里那烦人的计算量给指数级干掉。这就意味着以后处理超长文本或者做复杂任务的时候,效率肯定杠杠的。 代码、Agent和多模态现在可是大热门。全球都在朝着这三个方向使劲儿。在AI编程这块儿,HarnessEngineer这种AI工程师助手出来了,技术人员以后可能就是专门管理AI的管理者了。至于Agent集群嘛,OpenClaw那种东西也挺火的,智谱、MiniMax、腾讯这些国产大厂也都在推类似的东西。 咱们再看看国内其他厂商的情况。MiniMax的M2.7SWE-Pro在代码能力上有进步了,都能把Gemini 3.1 Pro给比下去。智谱的GLM-5也不错,用了DSA架构加上自研的“Slime”,处理多步骤任务挺在行。Kimi这次也把视觉能力加上去了,Agent集群模式上也有创新。小米的XiaomiMiMo-V2-Pro在调用Agent这块儿表现也挺好。 这就说明大家都在快速迭代。DeepSeek这波操作,估计能让中国AI更快走向世界。更便宜的tokens肯定能让全球API调用量猛增。投资策略上得盯着模型原厂、AI应用还有AI基础设施这三块儿看。模型平权了以后就不用担心应用跟不上了,会有更多AI Agent落地各行各业。成本降下来了用量自然就上去了,国产基础设施也会跟着受益。 DeepSeek V4.0一出来,国产大模型市场肯定又是一场大混战。他们有超强的超长上下文处理能力和更厉害的Agent能力,这肯定能推动AI应用更进一步。你说这次DeepSeek能不能在这么激烈的竞争中杀出来?评论区见!