Meta下周或推两款Llama 3小型非多模态版本 端侧AI部署再添新选择
5月10日,据《科创板日报》援引一位Meta员工消息报道,Meta或将会在下周推出两款Llama 3小型非多模态版本,并计划在今年夏天正式发布多模态Llama 3。新的小语言模型专门面向文本生成任务,暂不支持图像理解与生成功能,此次发布被业内视为Meta开源大模型生态从云端下沉至终端的关键一步,与此前已发布的Llama 3.2系列1B和3B端侧版本形成产品矩阵互补。
据悉,此次即将亮相的两款小型Llama 3模型均不搭载视觉能力,属于纯文本模型,旨在以低延迟和低成本满足开发者在轻量化场景中的推理需求。与完整版多模态Llama 3相比,小型模型在参数规模和计算资源消耗上大幅缩减,可以更低门槛在移动设备与边缘计算环境中完成本地化部署。据行业分析,较小的模型不仅运行成本更低、响应更快,尤其在当前大型模型推理开销高昂的背景下,对中小型开发团队而言性价比优势尤为凸显。
Meta此前已在Llama 3.2系列中推出1B和3B参数的端侧版本,明确标注“为端侧设计”,支持128K上下文窗口,能够在手机等消费级设备上运行。此次发布将进一步丰富Meta在轻量级产品线上的布局。当前端侧AI正成为行业趋势,越来越多厂商将目光投向可在设备本地离线运行的小型模型,以规避云端推理的高延迟与网络依赖问题。同时,小型模型更便于开发者在手机、平板等终端上快速构建AI应用,加速人工智能普惠化进程。
分析人士指出,Meta密集推进小型Llama 3版本的发布节奏,反映出其正在多层次构建开源模型生态,意图在对标OpenAI等闭源竞品的同时,通过开放权重策略吸引更多开发者进入其技术生态。预计该模型的发布将对国内大模型应用开发、边缘计算部署以及中小企业AI落地产生积极影响。
Gemini 3.1 Pro确认支持百万Token上下文窗口并内置原生多模态处理能力
« 上一篇
2026-05-10
Llama 4 MoE架构七牛云一键部署指南正式发布 私有化大模型落地进入分钟级时代
下一篇 »
2026-05-10