location_on 首页 keyboard_arrow_right 资讯 keyboard_arrow_right 正文

百度文心5.1 Agent能力超越DeepSeek-V4-Pro引关注 预训练成本仅为业界6%

资讯 2026-05-10 remove_red_eye 5 text_decreasetext_fieldstext_increase

5月10号,据IT之家报道,百度于日前正式发布的新一代基础大模型文心大模型5.1持续引发行业关注,其智能体构建工具调用规划能力已在多项权威基准测试中实现对DeepSeek-V4-Pro的超越,成为国产大模型在Agent能力赛道上的重要突破。

在行业最为关注的Agent基准评测中,文心5.1的表现呈现代际级提升。在τ³-benchSpreadsheetBench-Verified Agent等评测任务中,该模型性能明确超越DeepSeek-V4-Pro,在Agentic能力方面已趋近当前国际领先闭源模型。与此同时,在AIME26数学推理GPQA高阶知识推理MMLU-Pro等知识评测中,文心5.1同样展现出与顶尖模型媲美的综合实力。据LMArena大模型竞技场最新榜单,文心5.1以1223分登顶搜索榜国内第一、全球第四,是榜单中唯一入选的国产大模型。

这一能力跃升源自百度原创的多维弹性预训练技术。该技术支持一次训练产出多种规模的模型变体,文心5.1作为该技术的阶段性成果,完整继承了文心5.0的知识体系,同时将总参数量压缩至约三分之一、激活参数量压缩至约二分之一。配合分离式全异步强化学习基础设施多教师在线策略蒸馏算法,模型在参数效率层面实现显著突破——预训练成本仅为业界同规模模型的约6%

目前,文心5.1已通过百度千帆模型广场及文心一言官网上线,并将在超十个创意生产Agent平台陆续部署。随着Create 2026百度AI开发者大会临近,模型后续的商业化落地与应用生态拓展值得持续关注。对开发者与企业用户而言,Agent场景的选型策略宜将文心5.1纳入重点评估范围,尤其可将其在搜索能力Agentic任务规划方面的优势与真实业务需求进行匹配验证,规避模型频繁迭代带来的技术选型风险,构建更具成本效益的AI应用方案。

文心大模型5.1登顶LMArena搜索榜国内第一,国产大模型实现效率跃升
« 上一篇 2026-05-10
多维弹性预训练技术亮相,百度文心5.1实现极致成本控制
下一篇 » 2026-05-10