location_on 首页 keyboard_arrow_right 资讯 keyboard_arrow_right 正文

Meta下周或推两款Llama 3小型非多模态版本端侧AI部署再添新选择

资讯 2026-05-10 34

5月10日，据《科创板日报》援引一位Meta员工消息报道，Meta或将会在下周推出两款Llama 3小型非多模态版本，并计划在今年夏天正式发布多模态Llama 3。新的小语言模型专门面向文本生成任务，暂不支持图像理解与生成功能，此次发布被业内视为Meta开源大模型生态从云端下沉至终端的关键一步，与此前已发布的Llama 3.2系列1B和3B端侧版本形成产品矩阵互补。

据悉，此次即将亮相的两款小型Llama 3模型均不搭载视觉能力，属于纯文本模型，旨在以低延迟和低成本满足开发者在轻量化场景中的推理需求。与完整版多模态Llama 3相比，小型模型在参数规模和计算资源消耗上大幅缩减，可以更低门槛在移动设备与边缘计算环境中完成本地化部署。据行业分析，较小的模型不仅运行成本更低、响应更快，尤其在当前大型模型推理开销高昂的背景下，对中小型开发团队而言性价比优势尤为凸显。

Meta此前已在Llama 3.2系列中推出1B和3B参数的端侧版本，明确标注“为端侧设计”，支持128K上下文窗口，能够在手机等消费级设备上运行。此次发布将进一步丰富Meta在轻量级产品线上的布局。当前端侧AI正成为行业趋势，越来越多厂商将目光投向可在设备本地离线运行的小型模型，以规避云端推理的高延迟与网络依赖问题。同时，小型模型更便于开发者在手机、平板等终端上快速构建AI应用，加速人工智能普惠化进程。

分析人士指出，Meta密集推进小型Llama 3版本的发布节奏，反映出其正在多层次构建开源模型生态，意图在对标OpenAI等闭源竞品的同时，通过开放权重策略吸引更多开发者进入其技术生态。预计该模型的发布将对国内大模型应用开发、边缘计算部署以及中小企业AI落地产生积极影响。

Gemini 3.1 Pro确认支持百万Token上下文窗口并内置原生多模态处理能力

« 上一篇 2026-05-10

Llama 4 MoE架构七牛云一键部署指南正式发布私有化大模型落地进入分钟级时代

下一篇 » 2026-05-10

Meta下周或推两款Llama 3小型非多模态版本 端侧AI部署再添新选择

相关推荐

小卡

内容举报

Meta下周或推两款Llama 3小型非多模态版本端侧AI部署再添新选择