百川智能发布的医疗大模型Baichuan-M3凭借在全球权威评测HealthBench中的65.1分总分拿下了第一。这次登顶特别不容易,因为在评估复杂医学决策能力的Hard子项上,M3也以44.4分遥遥领先。更让人惊喜的是,在严肃医疗场景下,模型“胡说八道”的幻觉率低到了3.5%,把这种安全可靠的能力直接嵌入到了模型底层。Baichuan-M3通过算法创新,让机器学会像资深医生那样追问患者,把病人支离破碎的症状描述整理成结构化信息。百川智能的创始人王小川说,这套技术主要是为了帮助患者更好地参与健康管理,不会去抢医生的饭碗。因为现在全球科技巨头都在抢这块蛋糕,比如OpenAI推出了ChatGPT Health,Anthropic也弄出了Claude for Healthcare,竞争相当激烈。百川智能这次选择坚持开源,这对汇聚全球智慧、降低行业门槛有很大帮助。这种坚持让我们看到了我国在人工智能领域长期投入的成果,也验证了只要算法优化得好,就能把模型能力提上去。Baichuan-M3在全球权威评测中拿到好成绩,说明我国的技术和医疗产业结合得越来越深。它不仅展示了咱们的实力,还给出了AI辅助医疗的新思路。坚持走开放创新的路子,把解决实际问题放在首位,我国人工智能产业正在稳步向前走。