把1万亿和2000亿这两个数字放在一起看,这意味着DeepSeek打算把AI模型做大做强。DeepSeek V4和V4Lite即将发布,前者是完整的多模态模型,后者是简化版,但两者都在同一周上线。这款软件能生成图片、视频和文本,还能看懂它们。为了给中国制造的芯片提供更多机会,DeepSeek特意优化了V4,好让中国市场对半导体产品的需求更旺盛。官方打算在发布新版本时只发个小的技术说明,一个月后再放出详细报告。目前大家看到的消息都来自媒体爆料。关于V4Lite:它叫“sealion-lite”,一次能处理100万个tokens的文本,比起老款V3提升了近8倍。大家猜测完整版V4的参数量可能超过1万亿。据测试显示,V4Lite在处理复杂任务时表现优秀,比如用54行代码就能画出Xbox手柄这样的SVG图像。它的空间推理和结构化输出能力明显优于ClaudeOpus4.6和DeepSeekV3.2。国产芯片适配方面的进展也值得关注,DeepSeek希望借此加速AI模型在本土芯片上的推理速度。