location_on 首页 keyboard_arrow_right 资讯 keyboard_arrow_right 正文

文心5.1数学竞赛AIME26得分99.6，推理能力接近顶尖闭源模型

资讯 2026-05-10 24

5月10日，据百度文心官方消息，文心大模型5.1在颇具挑战性的美国数学邀请赛评测基准AIME26中取得99.6分的优异成绩，仅以微弱差距位居Gemini 3.1 Pro之后，排名全球第二。该成绩不仅刷新了国产大模型在数学推理领域的新高度，也标志着国产大模型的推理能力已接近全球领先闭源模型水平。

从技术实现层面来看，文心5.1取得这一突破的关键在于一系列底层训练架构的创新。该模型采用了多维度弹性预训练技术，基于Once-for-All弹性训练框架动态提取最优子结构，将总参数量压缩至文心5.0的约三分之一，激活参数量压缩至约二分之一，最终实现了预训练算力成本仅为业界同规模模型的约百分之六，在大幅降低训练成本的同时保持了旗舰级智力水平。此外，全新构建的分离式全异步强化学习架构与以多教师在线策略蒸馏为核心的多阶段强化学习后训练流程，有效解决了多目标优化冲突和训练效率问题，确保了数学推理与智能体、知识理解等多领域能力的全面高效融合。

该成绩不仅证明了国产AI大模型在高难度逻辑推理任务上已具备与国际顶尖模型正面竞争的实力，也为大模型在更广泛的科研辅助、教育培训及工业级数学推理应用等场景的落地，提供了极具竞争力的技术基座，进一步验证了通过架构创新实现高性价比AI智力服务的可行性路径。

多维弹性预训练技术亮相，百度文心5.1实现极致成本控制

« 上一篇 2026-05-10

文心5.1正式上线千帆模型广场，面向开发者全面开放

下一篇 » 2026-05-10

文心5.1数学竞赛AIME26得分99.6，推理能力接近顶尖闭源模型

相关推荐

小卡

内容举报