ReadCai财经资讯
当前位置:首页 » 13. 科技 » 人工智能

美团开源LongCat推理模型称多项评测达开源SOTA

2026-01-26

摘要:美团于2026年1月16日开源了其大型语言模型升级版LongCat-Flash-Thinking-2601。该模型在智能体搜索、工具调用等核心评测中达到开源模型领先水平,并在依赖工具调用的复杂任务上性能超越了Claude-Opus-4.5-Thinking,宣称可大幅降低新工具的适配成本。其核心特色是支持“重思考”模式,可同时启动8个并行“大脑”处理高难度问题,该模型将应用于美团业务,并已在官网提供免费体验。

线索:从投资角度看,此次开源行动可能旨在吸引开发者生态,巩固美团在AI应用层的基础设施地位,其宣称的卓越工具调用性能与降低适配成本的特点,若属实,可能加速AI智能体在本地生活、配送调度等核心业务的深度融合,提升运营效率与用户体验,构成长期价值支撑。潜在风险在于,“重思考”模式可能带来更高的计算资源消耗,影响成本控制;同时,将尖端模型开源虽能建立生态,但也可能使技术优势更快被同行追赶或模仿。

正文:2026年1月16日,美团宣布将其大型语言模型LongCat-Flash-Thinking的升级版LongCat-Flash-Thinking-2601正式开源。新模型在智能体搜索、智能体工具调用、工具交互推理等多项核心评测基准上,达到了开源模型的领先水平。在依赖工具调用的随机复杂任务中,其性能表现超越了Claude-Opus-4.5-Thinking模型,可大幅度降低在真实场景下为新工具进行适配训练的成本。此外,该模型支持一项名为“重思考”的模式。当遇到高难度问题时,此模式可同时启动8个并行思考进程协同工作,以分解和处理问题。美团表示,该模型将应用于其相关业务。目前,公众可在其官方网站上免费体验该模型。

发布时间:2026年1月16日 13:52

相关推荐

评论 ( 0 )

3.7 W

文章

73.0 W

点赞

回顶部