12月1日,DeepSeek宣布发布了两个正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。官方网站、App还有API都给更新到了正式版DeepSeek-V3.2,Speciale版本现在只以临时API服务开放。据介绍,DeepSeek-V3.2就是为了平衡推理能力和输出长度,适合做日常的问答或者通用智能体任务。在公开测试里,DeepSeek-V3.2的表现达到了GPT-5的水平,稍微不如Gemini-3.0-Pro,但是和Kimi-K2-Thinking比起来,V3.2输出得少多了,让等待时间也变短了。 今年1月12日,DeepSeek发布了一篇论文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》(基于可扩展查找的条件记忆:大语言模型稀疏性的新维度)。这篇论文是北京大学和DeepSeek共同完成的,梁文锋就在作者名单里面。大家当时就觉得这个论文可能会成为DeepSeek下一代模型V4的关键。 2月13日有消息说,DeepSeek网页或者App正在测试一个新的长文本模型结构,可以处理1M上下文。API服务还是V3.2这个版本,只支持128K上下文。外界觉得这个消息预示着DeepSeek今年春节又要放出大招,给大家来个“炸场”。 2025年网易有道词典公布年度词汇就是“deepseek”,搜索量达到了8672940次。他们说这个词在词典内部搜索量变化很大,从一开始突破算力封锁开始,每个重要进展都会让搜索量猛涨。 像这样能带来轰动的消息早就引起了行业的高度关注。去年12月1日DeepSeek同时发布两个正式版模型;今年1月12日又放出了关于“条件记忆”的论文;2月13日测试新结构的消息也出来了;还有一个关于网易有道词典的新闻也提到了“deepseek”这个词在年度词汇里位居榜首。所有这些事都说明DeepSeek确实是大模型风向标,大家都在盯着看呢!