Cursor放出了一个专为编程而生的AI工具,给它起了个名字叫Composer 2。大家都知道,做代码编辑器起家的Cursor这次搞了个大新闻。他们敢拍着胸脯说,新模型在写程序、修BUG这些事儿上,比咱们熟悉的Claude Opus 4.6表现得还要好。这个新玩具是通过他们的那个超火的AI编辑器拿给咱们用的。在公开场合亮明身份的Anysphere Inc公司透露,光靠着每天上百万的活跃用户基数,去年11月他们硬是把估值干到了293亿美元。这是一笔巨款!不过想要用好这玩意儿,得先把键盘敲出来的内容加到20万Token那么长。 Composer 2不仅能写代码、修BUG,还能跟电脑的命令行打交道。要是觉得功能不够劲,开发者还能自己选要不要给它挂上浏览器、图片生成器这些辅助工具。这次评估Cursor用的是自家的内部测试工具叫CursorBench,里头放的都是公司工程组做过的真实任务。平均每个挑战得分差不多是8个文件里352行代码的事儿。结果显示它拿了超过60%的分数排第三,排在它前面的是GPT-5.4那种用了更多硬件堆出来的高配模式。虽然比不上人家顶配,但把它的中低配和Claude Opus 4.6比下来,它可是妥妥的赢家。在另一个专门测在命令行干活能力的Terminal-Bench 2.0里,它更是直接碾压了Anthropic公司的模型。这就是为什么Cursor说他们的模型比别人家那些顶尖货色还要省钱省心。 价格方面那是相当的实惠:标准版是50美分买一送一(输入Token),2.50美元买一个(输出Token);如果图个速度快想换个贵点的版本也行,得花1.50美元买一送一加上7.50美元买一个。据彭博社那边的消息说这性价比之所以这么高,全是因为这货完全是冲着编程这一个领域的数据集去训练的;而其他那些什么都会干的大模型通常得把硬件搞得特别大才跑得动。为了简化开发过程,他们还用上了一种叫“自总结”的机器学习法子来压数据——毕竟有时候数据量实在太大了会超过模型的承受范围。 这次发大招对投资者来说肯定是个大好事。听说他们正在谈一轮融资呢,这要是钱到位了,把估值干到500亿美元也是轻而易举的事儿。Q&A时间到了!Q1:Composer 2到底是啥?有什么过人之处?A:这就是Cursor刚推的那款专门给写程序用的AI模型。它能支持20万Token那么长的输入,能写代码、能修BUG、还能跟命令行互动。性能这一块,它把Claude Opus 4.6这种对手给比下去了。Q2:多少钱?A:便宜版是50美分买输入Token加2.50美元买输出Token;想快点儿就选贵的那个:1.50美元买输入加7.50美元买输出。Q3:咋就比别的模型便宜呢?A:因为它只练写代码这一个活儿;而别的模型是全能选手练得多占资源多自然贵。这时候它就发挥了优势:专练一门课程降低了成本;再加上用“自总结”技术优化了数据处理过程。