摘要:红杉资本合伙人帕特·格雷迪与索尼娅·黄于2026年初联合发文,断言通用人工智能(AGI)时代已经到来。其核心观点是,AGI的本质是“把事情想明白”的能力,并已体现为能自主执行长周期任务的“智能体”。文中引用了一个具体案例:某AI智能体在31分钟内,通过多平台交叉分析,为一位创始人精准锁定了一名高度匹配的招聘人选。此外,引用独立评估机构METR的数据指出,AI完成长周期任务的能力约每7个月翻一番,据此推算,到2028年AI可可靠完成人类专家一天的工作,到2034年可完成一年的工作,到2037年则可处理需人类百年才能完成的任务。文章认为,AI正从“谈论者”转变为“执行者”,预示着一场工作模式与生产力关系的静默变革。
线索:本文揭示了AGI从概念论证迈向实际应用的关键转折,其中蕴藏着明确的投资线索与潜在风险。投资机会主要集中于两个层面:一是智能体框架与基础设施,即支撑AI进行长周期任务规划、记忆管理和工具调用的底层技术;二是垂直领域的专业化AI应用,如医疗诊断、法律辅助、芯片设计等领域的“AI员工”,其商业化落地路径更为清晰。然而,风险同样显著:首先,技术层面,AI在复杂任务中的“幻觉”与推理错误仍是现实瓶颈;其次,社会与经济层面,AI对白领工作的颠覆可能快于预期,将引发就业结构剧变与伦理监管挑战;最后,市场层面,伴随能力指数级增长,AI应用的竞争将急速加剧,技术路线的选择与生态构建能力成为生存关键。
正文:
红杉资本合伙人帕特·格雷迪与索尼娅·黄在2026年初联合发表观点,明确指出通用人工智能(AGI)已经到来。他们认为,AGI并非以觉醒或统治人类的戏剧化形式出现,而是体现在能够连续工作数十分钟至数小时的“长周期智能体”之中。
对于AGI的定义,他们提出了一个务实的标准:即“把事情想明白”的能力。这需要结合知识(通过预训练模型获得)、推理(依赖更强的计算模型)以及迭代试错(通过长周期智能体实现)三种能力。当AI能自主工作、自我修正并无需详细指令即可推进任务时,便具备了通用性。
一个具体的应用案例展示了这种能力。某创始人需要招聘一位“技术好、受工程师尊敬、且热爱使用推特”的开发者关系负责人。一个AI智能体接手该模糊任务后,并未进行简单关键词搜索,而是执行了如下复杂操作:首先在职业社交平台搜索相关公司的职位,但意识到头衔不可靠;随即转向视频平台,分析行业会议演讲者及其观众互动数据,以识别有真才实学的人;接着,将候选人名单导入社交媒体平台,通过分析发帖内容、粉丝互动及“网感”来评估真实性格;进一步,通过检查发帖频率下降等信号捕捉潜在跳槽意愿;最后,通过交叉验证排除近期升职或创业者,锁定了一位刚经历裁员、技术匹配且一段时间未更新职业档案的资深人士。智能体还起草了一封针对性的招募邮件。整个过程耗时仅31分钟。
AI能够执行此类长任务的关键在于“长周期智能体”技术的发展。这主要通过两种路径实现:一是在训练中使用强化学习让模型学会在长任务中保持专注;二是通过外部的智能体框架为AI提供任务规划与记忆管理等辅助。根据独立非盈利评估机构METR的追踪数据,AI完成长周期任务的能力大约每7个月翻一番。据此速率推算,到2028年,AI将能可靠完成人类专家一整天的工作量;到2034年,能完成相当于人类专家一年的工作量;到2037年,则能处理需要人类100年才能完成的任务,例如分析全部历史临床实验数据或重构庞杂的税法体系。
这意味着,“雇佣”AI智能体的时代正在开启。当前,人们已可以调用各类大型模型,而专业化的“AI员工”正在各领域涌现,例如:用于医疗咨询的AI、法律助理AI、网络安全AI、芯片设计AI以及研究型AI等。文章指出,2023至2024年的AI主要作为“谈论者”(智能的对话对象),而2026至2027年的AI正转变为“执行者”。这将颠覆工作模式,使人类从亲力亲为的执行者转变为管理AI团队的经理,使“售卖工作”成为可能。
综上所述,长周期智能体正以指数级速度发展。当AI不仅能回答问题,更能持续探索并执行解决方案时,所带来的不仅是工具升级,更是生产力关系的重构。
发布时间:2026-01-16 18:48:37



评论 ( 0 )