location_on 首页 keyboard_arrow_right 资讯 keyboard_arrow_right 正文

百度发布文心大模型5.1:参数量压缩至三分之一,性能反超DeepSeek

资讯 2026-05-10 remove_red_eye 5 text_decreasetext_fieldstext_increase

5月10号据IT之家最新资讯,百度于近日正式推出新一代基础大模型——文心大模型5.1。该模型已全面上线百度千帆模型广场及文心一言官网,面向企业用户与开发者开放体验。作为国产高效能大语言模型的最新代表作,文心5.1在显著降低模型体量的同时实现了核心能力的跨越式提升,迅速引起行业广泛关注。

此次升级的核心突破在于极致的参数效率优化。文心5.1充分继承了5.0版本的知识储备,通过底层技术创新将总参数量压缩至约三分之一,激活参数压缩至约二分之一。更引人注目的是,其预训练成本仅为业界同规模模型的6%,实现了推理成本的显著降低,树立了效价比标杆

实现这一代际跨越的关键在于“多维弹性预训练”技术。这项原创技术在文心5.0发布时首次提出,实现了“一次训练,处处部署”。研发团队构建了Once-for-All弹性训练框架,通过在弹性深度、弹性宽度与弹性稀疏度三个维度的动态调节,从子模型矩阵中提取出最优网络架构。该机制使模型在预训练阶段优先学习高价值知识,大幅压缩了算力消耗。

极致压缩并未牺牲性能,反而带来了智能体能力的显著反弹。在国际权威大模型竞技场LMArena最新排名中,文心5.1以1223分登上搜索榜国内第一、全球第四,是唯一上榜的国产模型。在权威基准测试中,文心5.1的Agent能力超越DeepSeek-V4-Pro,创意写作能力与Gemini 3.1 Pro相当,推理能力已接近业界领先闭源模型。

这一技术路线标志着大模型竞争正从参数规模比拼转向效率与落地能力的较量。文心5.1将强大的多源信息检索整合能力浓缩至轻量化模型,使智能助手、企业知识管理及Agent应用等复杂业务场景的部署门槛大幅降低。随着Create 2026百度AI开发者大会即将于5月13日召开,百度将进一步披露该模型的技术细节与商业化规划,有望为国产大模型的产业落地提供高效能新范式。

百度文心大模型5.1发布:预训练成本仅为业界6%,参数效率惊艳业界
« 上一篇 2026-05-10
文心大模型5.1登顶LMArena搜索榜国内第一,国产大模型实现效率跃升
下一篇 » 2026-05-10