location_on 首页 keyboard_arrow_right 资讯 keyboard_arrow_right 正文

多维弹性预训练技术亮相,百度文心5.1实现极致成本控制

资讯 2026-05-10 remove_red_eye 5 text_decreasetext_fieldstext_increase

5月10日据太平洋科技快讯,百度于5月9日正式推出新一代基础大模型文心大模型5.1,凭借多维弹性预训练技术实现重大突破,将预训练成本降至行业同规模模型的6%,在保持能力领先的同时完成极致成本控制,目前该模型已在百度千帆模型广场及文心一言官网同步上线。

文心5.1的核心突破源于百度原创的多维弹性预训练技术。该技术基于“一次训练、处处部署”的弹性训练框架,在单次预训练过程中通过动态采样机制覆盖多种参数规模的子模型矩阵。具体而言,模型在三个维度实现弹性压缩:弹性深度通过随机跳过部分Transformer层,使不同深度的子模型共享权重;弹性宽度通过动态调控专家池规模,提升MoE架构的专家利用效率;弹性稀疏度通过可变Top‑k路由机制灵活调整激活专家数量,实现推理开销与性能的动态平衡。基于上述技术,文心5.1将总参数压缩至约1/3激活参数压缩至约1/2,预训练算力成本仅为业界同规模模型的6%。

在性能表现上,文心5.1在多项权威评测中表现突出。根据LMArena大模型竞技场最新排名,文心5.1以1223分位列搜索榜国内第一、全球第四,是该榜单中唯一上榜的国产大模型。在智能体能力方面,文心5.1超越DeepSeek‑V4‑Pro;创意写作能力与Gemini 3.1 Pro相当;推理能力已接近全球领先闭源模型。研发团队还构建了分离式全异步强化学习基础设施,通过多教师在线策略蒸馏等多阶段训练流程,有效解决了多目标优化冲突和训练效率问题。

文心5.1的极致成本控制策略为行业提供了重要参考。通过多维弹性预训练实现一次训练产出多种规格模型,将预训练成本压缩至同规模模型的6%,相对文心5.0推理成本也显著降低。据透露,Create 2026百度AI开发者大会将于5月13日至14日在北京举办,届时百度将进一步披露文心大模型更多技术突破与产业落地进展。对于企业用户与开发者而言,通过千帆大模型平台修改模型名称即可调用API服务,当前正是评估接入低成本高性能大模型方案的有利窗口期。

百度文心5.1 Agent能力超越DeepSeek-V4-Pro引关注 预训练成本仅为业界6%
« 上一篇 2026-05-10
文心5.1数学竞赛AIME26得分99.6,推理能力接近顶尖闭源模型
下一篇 » 2026-05-10