智谱开源GLM-4.7-Flash上线，算力紧张限订阅

2026-02-11

摘要：智谱AI于2026年1月20日正式发布并开源了新一代轻量化大语言模型GLM-4.7-Flash。该模型采用混合思考架构，总参数量为300亿，激活参数量为30亿，将替代前代模型GLM-4.5-Flash在其开放平台免费提供。由于新模型发布后用户量激增导致算力资源紧张，智谱AI宣布自1月23日起，将其编程助手服务“GLM编程计划”的每日新增订阅量限制为原先的20%，以优先保障现有用户体验。

线索：

* 机会：1）技术迭代：GLM-4.7-Flash作为同级别先进模型发布并开源，展现了持续的技术进步，其轻量化设计有助于降低部署门槛，扩大潜在用户基础。2）需求验证：发布后用户量激增导致算力瓶颈，从侧面印证了市场对其AI服务（尤其是编程助手）的需求强劲，表明产品市场匹配度较高。3）生态策略：坚持免费开放核心模型，有助于构建开发者生态，为长期商业化奠定用户基础。

* 风险：1）运营瓶颈：算力短缺直接制约了服务扩容和收入增长，暴露出在需求快速爆发时，公司基础设施的弹性与规划可能存在不足。2）增长受限：主动限制新用户订阅（削减80%）虽为权宜之计，但短期内会直接影响用户增长速度和市场扩张步伐。3）行业通病与竞争压力：算力供需矛盾是AI高增长公司的普遍挑战，凸显了规模化运营的艰巨性。智谱AI在上市后即面临此类问题，需向市场证明其从技术领先到稳定、可持续商业服务的能力，以应对激烈的国际竞争。

正文：

2026年1月20日，智谱AI正式发布并开源了新一代大语言模型GLM-4.7-Flash。该模型是一个混合思考模型，总参数量为300亿（30B），激活参数量为30亿（3B）。作为同级别中的先进模型，GLM-4.7-Flash旨在为轻量化部署提供兼顾性能与效率的选择。即日起，该模型在智谱开放平台BigModel.cn上线，供用户免费调用，并替代其前代模型GLM-4.5-Flash。GLM-4.5-Flash将于2026年1月30日下线，此后相关请求将自动路由至新模型。

模型发布后，用户访问量出现激增。由于面临阶段性的算力瓶颈，智谱AI于2026年1月21日宣布，将对其编程助手服务“GLM编程计划”采取限流措施。自1月23日上午10时起，该服务的每日新增订阅量将被大幅削减至原有水平的20%，新增额度每日定点释放。公司表示，此举旨在优先保障现有订阅用户的使用体验和算力资源，现有用户的自动续订不受影响。近期，在高峰时段该服务已出现并发限制报错和响应延迟问题。

在高速增长的AI行业中，因用户激增而采取限流措施并非孤例。其他领先的AI公司在其服务快速增长初期，也曾为管理服务器容量而限制过访问。此类情况凸显了AI应用需求爆发与底层算力基础设施建设之间的阶段性矛盾。对于智谱AI而言，如何平衡用户规模的快速增长与服务质量、成本的可持续控制，是其上市后需要解决的核心运营挑战之一。

发布时间：2026-01-20 08:57:36

智谱开源GLM-4.7-Flash上线，算力紧张限订阅

相关推荐

评论 ( 0 )

取消回复

智谱开源GLM-4.7-Flash上线，算力紧张限订阅

相关推荐

评论 ( 0 )

取消回复

ReadCai财经资讯站