cnfinbench大语言模型综合评分,中国平安金融成功登榜首

最近,CNFinBench公布了一次大语言模型综合评分,中国平安金融成功登榜首。他们的PingAnGPT-Qwen3-32B模型表现突出,这次评测吸引了很多大模型参加,包括DeepSeek-R1、Qwen3-235B-A22B、Kimi-K2这些开源模型,还有GPT-4o、Claude-Sonnet 4、Doubao-1.5-pro这些商业闭源模型。这个评测体系是上海人工智能国家实验室和金融领域权威机构共同打造的。PingAnGPT-Qwen3-32B在金融事实推理与计算、知识问答、合规与风险控制这些方面表现得非常优秀。它精确地处理金融数值计算,逻辑推理也很严谨,还掌握了广泛的金融领域知识。特别是在投资研究分析和风险计量场景里,这个模型有重要应用价值和安全性。平安用这个32B参数规模的模型把性能超越了671B参数的DeepSeek-R1和1000B参数的Kimi-K2。而且它还支持97个不同的业务场景,比如产险车险报案、人事员服智能问数等等。CNFinBench这次评分给PingAnGPT-Qwen3-32B的全面评估都是正面的。它覆盖了专业知识问答、业务理解分析、事实推理计算、合规风险控制还有安全等多个维度。平安的数据沉淀也很厉害,2025年前三季度已经积累了30万亿字节数据,涵盖2.50亿个人客户。这些数据支持他们积累了超3.2万亿高质量文本语料,还有31万小时标注语音语料和75亿图片语料。这次在CNFinBench中拿到第一名让平安在技术领域更有自信。他们希望通过持续优化模型来提供更好的服务。国家知识产权出版社也发布了《金融科技行业2025年专利分析白皮书》与《医疗健康行业2025年专利分析白皮书》。中国平安在这两个领域都获得了专利数的双榜首。2026年2月的这个消息让平安更有动力继续推动科技创新。中国平安把高质量数字化金融供给作为目标,希望让人们享受更好的生活。他们也承诺用省心、省时又省钱的服务来实现这个目标。