数据:
Meta推出的新开源模型V-JEPA 2,具备12亿参数,并经过100万小时视频训练,能够更好地理解3D环境和预测物理世界的运作规律,尤其在自动驾驶和送货机器人等应用中具有优势。
线索:
V-JEPA 2的推出为人工智能领域带来了新的投资机会,特别是在自动驾驶、机器人技术及相关软件开发中。然而,也需关注与英伟达等竞争者的比较,以及Meta是否能维持其技术优势。市场可能会受到依赖新技术的产出与产品变革的影响。
正文:
Meta近期发布了名为V-JEPA 2的开源模型,旨在提升人工智能对3D环境的理解能力及其在物理世界中推理的能力。V-JEPA 2被称作世界模型,这种系统借鉴了物理世界的运作逻辑,以构建内部的虚拟环境,从而使人工智能能够更加接近人类的方式进行学习、规划和决策。
这一模型拥有12亿个参数,并经过超过100万小时的视频训练。Meta宣称,V-JEPA 2在视觉理解和对物理世界反应的预测上达到了业内先进水平。模型可以判断,例如,一个球从桌子上滚落时的行为,以及被遮挡的物体不会消失的情境。
Meta指出,V-JEPA 2在自动驾驶汽车和送货机器人等领域的应用具有显著优势,因为这些系统需要在复杂多变的环境中安全操作。与传统需要大量标注数据或视频片段的模型不同,V-JEPA 2采取了一种简化的“潜在空间”推理方式,以理解物体的移动和相互作用。
在对比方面,Meta表示,V-JEPA 2在性能上较英伟达的Cosmos模型快30倍。尽管如此,Meta的评估基准标准可能与英伟达有所不同。Meta的首席人工智能科学家Yann LeCunn指出,让机器理解物理世界与理解语言是完全不同的挑战。他强调,世界模型作为一种虚拟的、简化版的现实环境,能够帮助人工智能理解世界并预测为其行为的结果,从而制定行动计划以完成既定任务。
LeCunn还表示,世界模型将开启机器人技术的新纪元,使得现实生活中的人工智能助手在无需大量训练数据的情况下,也能帮助人们进行家务和体力劳动。
发布时间:
2025-06-12 00:13:20
评论 ( 0 )