location_on 首页 keyboard_arrow_right 资讯 keyboard_arrow_right 正文

蚂蚁百灵发布万亿级旗舰思考模型Ring-2.6-1T:引入可调节推理机制,评测成绩亮眼

资讯 2026-05-10 remove_red_eye 4 text_decreasetext_fieldstext_increase

5月10号,据IT之家资讯报道,蚂蚁集团旗下百灵大模型在5月9日正式发布了万亿级旗舰思考模型Ring-2.6-1T,这是一款面向Agent、Coding与企业工作流等真实复杂任务场景打造的万亿级大模型,主打可调节推理深度与高效执行能力。该模型已上线OpenRouter平台并开放限时一周免费体验,后续将于近期正式开源

从技术层面看,Ring-2.6-1T的核心亮点在于引入了可调节的Reasoning Effort机制,支持highxhigh两种推理强度。其中,high模式面向高频Agent工作流,具备更低Token开销与更快多步执行能力,适用于多轮交互、工具协作及任务拆解等生产级默认调用场景;xhigh模式则面向数学、科研、复杂逻辑分析与多路径探索等高难任务,为复杂推理提供更充分的思考空间,在效果、速度与成本之间实现更优平衡。

在性能评测方面,Ring-2.6-1T表现突出。在真实任务执行类评测中,PinchBench得分达到87.60,高于GPT-5.4 xHigh、Gemini-3.1-Pro high与Claude-Opus-4.7 xhigh等头部模型;Tau2-Bench Telecom得分95.32,与最高分模型差距不足1分。在高难推理任务方面,ARC-AGI-V2得分77.78,与Gemini-3.1-Pro high和Claude-Opus-4.7 xhigh处于同一水平线。

随着大模型逐步进入Agent、工程开发及企业工作流等真实生产环境,行业对推理能力的需求正从“模型是否足够聪明”转向“能否以合理推理成本稳定完成任务”。Ring-2.6-1T通过可调节推理强度机制,为开发者在高频任务与高难任务之间提供灵活选择,有助于降低企业大模型应用的综合成本。该模型的后续开源,也将进一步完善开源生态中的万亿级推理模型版图。

文心5.1正式上线千帆模型广场,面向开发者全面开放
« 上一篇 2026-05-10
阶跃星辰StepAudio 2.5 Realtime登顶中国语音模型榜首
下一篇 » 2026-05-10