摘要
火山引擎发布了豆包大模型1.8及音视频创作模型Seedance 1.5 Pro。豆包大模型1.8针对多模态Agent场景优化,增强了工具调用与复杂指令遵循能力,并具备256K超长上下文。其日均Token使用量已超过50万亿,自2024年5月以来增长417倍,目前有超过100家企业客户累计使用量超万亿。为降低企业成本,推出了覆盖全系模型的“AI节省计划”,最高可节省47%的费用。
线索
此次发布揭示了字节跳动在AI领域的核心战略:通过规模效应和生态整合构建竞争壁垒。日均50万亿Tokens的惊人调用量不仅验证了其市场领先地位,也为通过大幅降价(最高47%)来挤压竞争对手、加速市场渗透提供了基础。投资机会在于关注其AI云服务的增长潜力,特别是围绕Agent开发的整套工具链,如AgentKit、推理服务和向量数据库,这些旨在锁定企业客户,形成类似AWS在云计算时代的平台效应。主要风险在于AI技术迭代迅速,市场仍处早期阶段,Agent等应用的商业化路径尚不明朗,企业客户投入产出比存在不确定性。同时,激烈的全球竞争和维持高研发投入与激进定价策略下的盈利能力,也是长期挑战。
正文
在2025年原动力大会上,火山引擎发布了豆包大模型1.8(Doubao-Seed-1.8)和音视频创作模型Seedance 1.5 Pro。
豆包大模型1.8在核心能力上进行了升级。模型面向多模态Agent场景进行了优化,工具调用能力、复杂指令遵循能力及OS Agent能力得到增强,提升了在处理复杂任务时的规划与执行水平。它拥有256K超长上下文和原生API上下文管理,能够处理复杂多步任务。在视觉理解方面,单次视频理解帧数从640帧倍增至1280帧,支持以低帧率理解超长视频,并对关键片段进行高帧率分析,此能力可应用于在线教育、产品质检和安防监控等场景。
截至2025年12月,豆包大模型日均Token使用量突破50万亿。这一数据相较于2024年9月的30万亿有显著增长,相比2024年5月刚推出时的日均1200亿,增长了417倍。平台“万亿Tokens俱乐部”成员已突破100家,即超过100家企业客户累计Token使用量超过一万亿。
与主模型同步发布的,还有多个多模态创作模型。Seedance 1.5 Pro音视频创作模型采用原生音视频联合生成架构,支持环境音、背景音乐、人声等元素,实现了毫秒级的音画同步输出。模型支持多人多语言对话,口型对齐精准,覆盖中文方言(如四川话、粤语)、英文及小语种。即将上线的“Draft样片”功能,可先生成低分辨率样片预览,关键要素与最终成片高度一致,据称可提升65%的整体效率并减少60%的无效创作成本。个人用户可在豆包、即梦AI等平台体验该模型,企业用户从12月23日起可通过火山引擎API接入。此外,火山引擎还发布了图像创作模型Doubao-Seedream-4.5,具备多图组合、创意写真、虚拟试穿与海报设计等能力。
火山引擎进一步完善了其推理与开发服务生态。推出的“火山方舟”推理代工服务,已接入Qwen、GLM等主流开源大模型,支持企业将精调后的模型一键Serverless部署。Viking系列产品包括VikingAI搜索与VikingDB向量数据库,支持文本、图像跨模态检索和个性化推荐。在Agent开发方面,企业级AI Agent平台AgentKit与TRAE(CN)企业版已升级,支持10万文件、5亿行代码的超长上下文,并提供代码全链路加密、云端零存储等安全保障,已有NIO、PwC、汇付天下等客户采用。
为降低企业使用成本,火山引擎推出了“AI节省计划”。该计划采用一次性加入机制,覆盖豆包大模型、视频图像创作模型及第三方开源大模型,最高节省幅度达47%,支持全预付、零预付等灵活付款方式。
针对Agent与APP的关系,火山引擎总裁谭待表示,目前讨论二者冲突为时过早,AI落地仍处早期阶段。他认为用户核心价值在于更便利、更低成本地达成目标,载体是Agent还是APP并不重要,未来将形成Web、APP、Agent共存互补的格局。智能算法负责人吴迪补充称,行业对AI与Agent的探索仍处于摸索阶段,预计该状态将持续三年左右,核心挑战在于完善Agent工具。
谭待还分析了多模态发展的意义,认为它标志着AI应用向更深场景的渗透。对于行业竞争,他认为当前首要任务是共同做大市场,帮助各行业更快实现AI落地。他判断,在AI技术快速迭代的背景下,传统的私有化一体机模式将被淘汰,以模型为中心的AI云原生架构将成为主流,MaaS(模型即服务)业务的重要性将类似AWS的EC2服务。
发布时间
2025-12-18 11:56:00



评论 ( 0 )