摘要:英伟达发布了一款名为NitroGen的开源通用游戏AI模型。该模型通过观看总计约40,000小时、涵盖超过1,000款游戏的视频进行训练,能够主动操作多种类型的游戏,展现了较强的泛化能力。在实际测试中,该模型能完成游戏中的基本操作,但整体水平有限,类似新手玩家。其核心研究价值在于为通用机器人提供基础的“条件反射”或直觉能力,而非替代人类玩家。
线索:
* 投资机会:
1. 通用AI模型发展:该项目展示了通过海量多模态数据(视频)训练通用智能体的技术路径,可能推动AI在复杂环境理解和决策方面的发展,相关算法和基础设施提供商可能受益。
2. 机器人技术前置:将游戏环境作为训练机器人的低成本、高多样性模拟场,是当前主流研究方向。该模型的成功验证了“从虚拟到现实”策略的可行性,可能加速具身智能和通用机器人的研发进程。
3. 英伟达生态强化:作为底层算力与AI技术的推动者,英伟达通过此类研究项目巩固其在该领域的领导地位和生态系统吸引力。
* 投资风险:
1. 技术成熟度:模型当前性能有限(依赖“时间暂停”、仅具备条件反射),距离实际应用(如高水准游戏陪练或复杂机器人控制)仍有很长的路要走,存在研发不及预期的风险。
2. 商业化路径模糊:作为开源科研项目,其直接商业价值(如游戏领域)目前不明确,相关投资可能需着眼于长期技术积累而非短期回报。
3. 伦理与公平争议:此类技术若被不当用于游戏自动化(即“外挂”),将引发严重的公平性问题,可能导致监管风险或舆论反噬。
正文:
英伟达发布了一款名为NitroGen的通用游戏AI模型。该模型能够根据游戏画面主动生成操作指令,并支持在不同游戏间切换,无需针对单一游戏进行专门训练。模型的相关资源,包括模型权重和数据集,已对外开源。
对该模型的实际测试显示,它能够在《赛博朋克2077》中完成反杀操作,在《黑神话:悟空》中实现喝药、翻滚、技能衔接等动作,在《空洞骑士》中流畅进行平台跳跃,并能作为玩家2参与《茶杯头》的双人游戏。测试也暴露出其局限性:在《黑神话:悟空》中,它依赖顶级装备且会出现丢失锁定、技能放空的情况;在《赛博朋克2077》中,常态表现为驾驶撞墙、瞄准失误;在《茶杯头》中,则难以跟上人类玩家的节奏。总体评价是,该模型具备大多数游戏的基本操作和机制认知,水平相当于刚接触游戏的新手,目前仅支持手柄操作的游戏。
该模型的技术原理是基于大规模游戏视频进行训练。研究团队从互联网收集了38,739个总计约40,000小时的游戏视频,覆盖超过1,000款游戏。视频类型分布以动作RPG(占34.9%)和平台跳跃游戏(占18.4%)为主,也包括动作冒险、体育等多种类型。训练时,团队选择了带有手柄按键指示器的视频,并利用专门模型从每一帧画面中提取对应的按键动作数据,从而使AI学会将特定画面与操作关联起来。这使其类似于通过观看大量游戏直播自学而成的“云玩家”。
在运行机制上,模型通过实时截取游戏屏幕进行分析和决策。为解决AI推理速度跟不上实时游戏的问题,英伟达开发了可拦截系统时钟的工具,使游戏在AI计算下一动作时暂停,实质上是将游戏转变为“回合制”。若关闭此功能,模型会因反应不及而失效。论文指出,NitroGen主要训练的是基于瞬时画面的“条件反射”或“肌肉记忆”,缺乏长远的战术规划能力,这解释了其有时会做出无意义动作的原因。
研究人员强调,该模型的主要价值不在于游戏通关能力,而在于其“通用性”——能够不经特定训练即理解多种环境的基本交互规则。英伟达表示,其真正目标是服务于机器人研究。如果机器人能像该模型一样,天生具备“遇到障碍要躲避”、“看到目标要接近”等基础直觉,将极大简化机器人应对复杂现实世界的训练过程。这标志着向通用型机器人研发迈进的一步。
发布时间:2025-12-29 09:54:57



评论 ( 0 )