ReadCai财经资讯
当前位置:首页 » 13. 科技 » 人工智能

未知

2025-12-11

数据:

73%的从业者表示部署Agent的首要目的是“提高生产力”,85%的案例使用闭源模型。

线索:

此次报告揭示了AI Agent在各个行业中的应用现状,其中金融业成为应用的主要领域。尽管存在对可靠性的担忧,但采用\”约束性部署\”策略使得AI Agent系统得以在实际中顺利运行。投资机会可能在于开发基于闭源模型的解决方案和AI Agent的安全性及可靠性提升策略。

正文:

加州大学伯克利分校发布了一项关于AI Agent的重磅论文,内容基于306名从业者的深度调研和20个来自26个行业的企业级案例,这是该领域迄今为止规模最大的实证研究。报告指出,生产力提升是Agent落地的最大推动力,闭源模型配合人工Prompt及受控流程是目前的主要模式,同时可靠性仍是面临的最大挑战。

73%的从业者认为部署Agent的首要目标是提升生产力,63.6%的人希望减少人工工时,50%则追求自动化常规任务。相比之下,以风险规避和故障响应为目标的项目排序较后。金融行业是Agent应用的首要领域,占比39.1%,其他如科技和企业服务也有显著应用。

Agent的应用已经超出以往的写代码和聊天机器人,涉及保险理赔、生物医学工作流及企业内部支持等多领域。当前,92.5%的Agent直接为人类服务,其中大部分服务于企业内部员工,系统响应速度并非首要考量。

在技术路径上,从业者更倾向于选择闭源模型,85%的案例使用如Anthropic的Claude和OpenAI的GPT系列,优先选择简单可控的方法。大部分团队在构建过程中避免微调,专注于Prompt的编写,78%使用全手动或人工辅助的方式构建生产环境。

在评估方面,75%的团队放弃基准测试,理由是企业业务的特殊性,转而建立自定义的评估标准。人工循环验证仍是主要评估方式,51.6%的团队结合LLM作为裁判。

报告总结指出,当前Agent面临的最大挑战是可靠性,37.9%的从业者认为这是核心技术问题。难度在于基准建立复杂、测试的不可确定性以及反馈延迟。然而,通过“约束性部署”,Agent得以在生产中安全运行。

最终结论是,利用现有的前沿模型和简易提示技术,可在多个行业中创造出显著的商业价值,企业无需等待AGI即可实现显著的生产力提升。

发布时间:

None

相关推荐

评论 ( 0 )

3.2 W

文章

57.0 W

点赞

回顶部