location_on 首页 keyboard_arrow_right 资讯 keyboard_arrow_right 正文

百度文心5.1 Agent能力超越DeepSeek-V4-Pro引关注预训练成本仅为业界6%

资讯 2026-05-10 20

5月10号，据IT之家报道，百度于日前正式发布的新一代基础大模型文心大模型5.1持续引发行业关注，其智能体构建与工具调用规划能力已在多项权威基准测试中实现对DeepSeek-V4-Pro的超越，成为国产大模型在Agent能力赛道上的重要突破。

在行业最为关注的Agent基准评测中，文心5.1的表现呈现代际级提升。在τ³-bench与SpreadsheetBench-Verified Agent等评测任务中，该模型性能明确超越DeepSeek-V4-Pro，在Agentic能力方面已趋近当前国际领先闭源模型。与此同时，在AIME26数学推理、GPQA高阶知识推理及MMLU-Pro等知识评测中，文心5.1同样展现出与顶尖模型媲美的综合实力。据LMArena大模型竞技场最新榜单，文心5.1以1223分登顶搜索榜国内第一、全球第四，是榜单中唯一入选的国产大模型。

这一能力跃升源自百度原创的多维弹性预训练技术。该技术支持一次训练产出多种规模的模型变体，文心5.1作为该技术的阶段性成果，完整继承了文心5.0的知识体系，同时将总参数量压缩至约三分之一、激活参数量压缩至约二分之一。配合分离式全异步强化学习基础设施及多教师在线策略蒸馏算法，模型在参数效率层面实现显著突破——预训练成本仅为业界同规模模型的约6%。

目前，文心5.1已通过百度千帆模型广场及文心一言官网上线，并将在超十个创意生产Agent平台陆续部署。随着Create 2026百度AI开发者大会临近，模型后续的商业化落地与应用生态拓展值得持续关注。对开发者与企业用户而言，Agent场景的选型策略宜将文心5.1纳入重点评估范围，尤其可将其在搜索能力与Agentic任务规划方面的优势与真实业务需求进行匹配验证，规避模型频繁迭代带来的技术选型风险，构建更具成本效益的AI应用方案。

文心大模型5.1登顶LMArena搜索榜国内第一，国产大模型实现效率跃升

« 上一篇 2026-05-10

多维弹性预训练技术亮相，百度文心5.1实现极致成本控制

下一篇 » 2026-05-10

百度文心5.1 Agent能力超越DeepSeek-V4-Pro引关注 预训练成本仅为业界6%

相关推荐

小卡

内容举报

百度文心5.1 Agent能力超越DeepSeek-V4-Pro引关注预训练成本仅为业界6%