那个欧洲AI界的新星Mistral发布了新的小模型Small 4,咱们一起来看看它有啥本事。在2023年的时候,Arthur Mensch、Guillaume Lample和Timothée Lacroix这三位从DeepMind还有Meta出来的大佬创立了这家公司。Small 4这回可是真正的多面手,把推理、多模态理解还有编程能力都融在一块了。开发者再也不用纠结该用哪个垂直模型了,这回全都给你搞定。 模型用的是MoE架构,这玩意儿挺聪明的。核心参数有1190亿,可别吓到了,实际运行的时候只会激活60亿个,这就叫把性能和效率给平衡好了。上下文窗口能搞到256k,写代码的时候那些长文档根本不在话下。 除了大,它的响应速度也很快。在延迟优化模式下,完成时间缩短了40%;在吞吐量模式下,每秒处理的请求数是以前的三倍。官方数据显示,它跟OpenAI那个GPT-OSS120B比起来也不差啥。 虽然厉害,但硬件也得跟上才行。Mistral把建议直接给你标好了:最低配得用4个英伟达HGX H100或者1个英伟达DGX B200;要是想要最顺滑的体验,官方建议用4个英伟达HGX H200或者2个英伟达DGX B200的组合。 这牌子由Arthur Mensch、Guillaume Lample和Timothée Lacroix三位大佬在2023年成立的。最近欧盟还在忙着搞那个《人工智能法案》,也就是AI Act,就是想把AI应用给规范规范,一边促进创新一边保障安全和伦理。 这次Small 4发布之后,Mistral肯定是把自己在开源大模型这块的地位给坐实了。以后大家用AI的时候说不定就能看到它的身影了。