联想搞了个面向企业的大动作,把每百万tokens的成本给压到了1元以下。这事儿是3月

联想集团搞了个面向企业的大动作,把每百万Tokens的成本给压到了1元以下。这事儿是3月26号正式宣布的,方案里整合了万全异构智算平台、问天WA5480 G3服务器还有配套的网络设备,专门给企业搭一个高阶的算力集群。 这个方案主打几个点:智商高、安全性强、价格便宜,能私有化部署。官方数据说,它能把高质量Tokens的成本控制在1元以内,跟云服务比起来便宜了一大截,响应延迟也能控制在12毫秒以内。同时它能扛住1000个智能体同时跑活儿,4K的上下文下一天能输出上百亿Tokens。 从个人“养虾”到企业“用虾”的变化,现在智能体这股风正往企业那边刮呢。不过个人版搬到企业用可不容易,有数据泄露、推理出岔子、上下文记不住、不够快、成本高这些问题。这次“龙虾湖”就是冲着这些痛点来的。 它采用了私有化部署,企业能完全管着数据怎么流通。把知识库统一存起来管理好,让个人的知识和公司的知识都沉淀下来。这对金融、政务、制造这些敏感行业特别关键。 安全性这块弄了四层防护:底层用容器隔离,核心系统自己研发还做了高强度扫描,WAF、DDoS防护都加上了;交互层拦住坏指令和奇怪操作,日志还能自进化更新防护;Skill层检查代码安全;最后权限管控层盯着高危操作。 算力这块儿也做了优化。支持DeepSeek这样的大模型部署,参数能从32B到671B不等。多模协同调度技术能让大小模型分工协作:大的模型干复杂活儿,小的模型应付高频简单的查询。 为了应对“失忆”问题,搞了个QMD长期记忆系统。这个系统能突破单实例的限制,让多个智能体共享记忆。 性能优化方面通过KV Cache的生命周期管理来提升效率;GPU和CPU资源也能统一调配。 部署模式有两种:集中式适合追求效率的企业;分布式则把大模型放在GPU节点上。这个方案支持一键装和卸,升级维护也管了。官方说这玩意儿能覆盖IT、行政、业务中台这些部门,包括全员办公、处理敏感数据和智能化生产这些场景。