数据:
发布时间:2025-02-14 10:02:00
线索:
DeepSeek推出的R1推理大模型在推理性能上与OpenAI的o1模型相当,但计算成本和响应速度显著降低。这为金融行业带来了更多的AI应用机会,同时也引发对当前通用模型的竞争与共存的思考。R1的推出可能促进中小金融机构的AI应用,但其在实现落地时需克服数据和算力的挑战。
正文:
随着金融行业对AI模型的不断探索,现有的共识是,大模型虽然能在海量数据中快速回应,却无法完全满足实际业务需求,因而“慢思考”的推理模型变得不可或缺。自OpenAI的o1模型去年推出以来,其通过强化学习提升了复杂问题的推理能力。然而,相较于通用大模型的瞬时反应,o1在计算和速度方面消耗较大,响应时间通常需要约10秒。
在2025年春节前,DeepSeek正式发布了其DeepSeek-R1推理大模型,并同步开源了模型权重。这一模型是全球首个成功复现o1能力的模型,其推理性能与o1相当,但算力消耗仅为十分之一,输入token价格更低,极大降低了费用。金融行业的一位高管对R1模型的发布表示欣喜,认为其性价比足以支持大量创新项目的涌现。
深度推理大模型的R1,虽仍需传统通用大模型的语料训练及参数调整,但它通过开源实现AI应用的平权,能为中小金融机构带来更大的应用想象。与此同时,尽管有多家金融机构接入R1模型,这并不意味着其他通用模型的退场。不同技术模型将按需共存,以应对多样场景的实施落地。
R1模型的深度推理能力使其在复杂数据分析中表现突出,但其表现也显示出幻觉现象与传统通用模型类似。AI幻觉率高达14.3%,远高于V3模型的3.9%。因此,加之算力与数据问题,金融行业在模型落地时仍需解决更为复杂的挑战。此外,不同金融机构在接入模型时会根据资源、成本和实际应用差异化选择。
尽管接受DeepSeek的深度推理模型,其带来的创新应用却将在金融行业引起一场变革。在数家金融机构尝试接入DeepSeek的代码语言模型基础上,R1的推出将进一步强化其应用潜力。从而带动“AI+经纪”“AI+投研”“AI+合规”等新兴模式的探索。
发布时间:
2025-02-14 10:02:00



评论 ( 0 )