ReadCai财经资讯
当前位置:首页 » 13. 科技 » 人工智能

AI模型在物理任务表现不佳,蓝领工人 unaffected

2025-05-22

数据:

在基本物理任务上,前沿AI模型仍会失败,顶尖模型在零件加工任务中表现不佳,未来AI自动化将主要针对白领工作,而蓝领工作不受影响。

线索:

当前的AI模型在物理任务与视觉理解上存在明显不足,特别是在复杂的制造场景中,未能展现出与人类技术工人同样的能力。这样的局限性可能导致投资者在AI技术的应用领域中需谨慎评估白领与蓝领工作的自动化替代风险,制造业的传统技术工人或将保持相对稳定。

正文:

在基本物理任务中,前沿的AI模型如OpenAI的o3和Gemini 2.5 Pro在零件加工的测试中全部未能达标。尽管o3的智商高达136,然而在此次任务中其表现不如经验丰富的工人。专家Adam Karvonen评估后认为,AI将会自动化许多白领工作,但蓝领工作不会受到同样影响,自动化不会在全行业均匀展开。

评估零件制造任务的过程相对简单,技师通常将其视为常规工作,但前沿模型在这一领域经常出现明显错误,尤其是在视觉能力和物理推理方面。大部分模型在视觉上表现不佳,无法准确描述零件的特征。而即使在视觉能力有所提升的情况下,例如Gemini 2.5 Pro,仍存在物理推理错误,例如对工件夹持的不合理建议。

Karvonen指出,虽然现有的AI模型在教科书知识上表现尚可,但在实际制造中却常常缺乏有效的应用。他强调如今的模型在制造行业的核心业务中几乎无用。

改善AI在物理任务上的表现不是简单的过程,结构复杂的物理世界包含了许多无法通过现有数据轻易捕捉的细节。此外,缺乏清晰的奖励信号以及高成本和风险的试错方法也为AI在物理领域的进一步发展带来了挑战。

尽管如此,AI研究的进展与合成数据的应用可能为未来的发展提供新的可能性。如果当前的趋势持续下去,将可能出现巨大的自动化差距,导致社会阶层的紧张,加剧公众对AI的反对,甚至让体力劳动成为技术进步的瓶颈。

发布时间:

2025-05-20 20:37:20

相关推荐

评论 ( 0 )

2.8 W

文章

35.3 W

点赞

回顶部