摘要:中国人民大学高瓴人工智能学院研发的多模态研报生成系统“玉兰·融观”(FinSight),能够自动拆解任务、从多源异构数据中搜集信息,并生成包含专业图表、长度超过2万字的图文研究报告。该系统在AFAC 2025金融智能创新大赛的1289支队伍中夺冠,并在多项评测中的事实准确性、分析深度与呈现质量上超越了GPT-5 w/Search、OpenAI Deep Research与Gemini-2.5-Pro Deep Research等系统,综合评分达8.09,其中可视化维度评分达9.00。
线索:
* 投资机会:该系统展示了AI在高度专业化、流程复杂的金融投研领域实现深度应用的潜力。其成功意味着AI驱动的研究工具可能显著提升投资研究的效率和覆盖面,为开发垂直领域专业Agent的科技公司、寻求降本增效的金融机构以及数据分析服务商带来新的发展机遇。其“代码驱动可变内存智能体架构”等核心技术范式,也可能成为其他专业领域(如法律、医疗、科研)AI解决方案的参考蓝本。
* 潜在风险:技术的实际落地面临挑战,包括对数据源质量与实时性的高度依赖、复杂模型可能存在的“黑箱”决策风险、以及生成内容的事实准确性仍需在多变市场环境中持续验证。此外,此类系统的普及可能加剧金融信息市场的同质化,并对传统金融分析师的职业结构产生影响,相关监管与伦理框架也需同步构建。
正文:
中国人民大学高瓴人工智能学院提出一个面向真实金融投研场景的多模态研报生成系统,名为“玉兰·融观”(Yulan-FinSight)。该系统能够响应用户的研究需求,自动拆解任务,并从互联网和金融数据库中搜集包括股价、财报、新闻在内的多源异构数据,最终生成包含“发展历程”、“核心业务架构”、“竞争格局”等章节的万字图文报告。
金融研究报告是一项高度结构化、强逻辑、强可视化的专家级工作。现有通用AI系统在此领域面临三方面主要挑战:一是领域知识与数据割裂,难以统一处理结构化金融数据与非结构化信息;二是专业级可视化能力缺失,难以生成满足多维对比、事件标注等需求的复杂金融图表;三是缺乏“迭代式研究”能力,无法像人类分析师一样根据中间发现动态调整研究重点。
为应对这些挑战,FinSight系统模拟人类金融专家的工作方式,采用了三项关键技术创新。
第一项是核心架构创新,采用了名为“代码驱动的可变内存”(Code-Driven Variable-Memory, CAVM)的多智能体架构。该架构摒弃了传统的对话式记忆范式,将数据、工具与中间推理结果统一映射为可读写的程序变量,由多个代码智能体通过共享变量空间进行协同推理。这种设计将数据(如财务报表、行情)、工具(如搜索、绘图)和智能体本身都抽象为可编程变量,通过Python代码进行调度,旨在为长时程、多流程的专家级推理提供结构支撑。
第二项是视觉生成机制的创新,提出了“迭代式视觉增强机制”。该机制采用“执行者-评审者”协作范式:文本大模型作为“执行者”,负责生成可执行的绘图代码;视觉语言模型作为“评审者”,对生成的图像进行视觉层面的审视,并从数据完整性与美观性等维度提供反馈。系统通过多轮“生成—评估—修正”的迭代过程,持续优化图表质量,最终能够生成包含双轴对齐、事件标注等复杂结构的专业金融图表。
第三项是写作框架创新,采用了“分析—整合”的两阶段写作框架。首先,系统会生成一组“分析链”,每条链针对一个明确的子任务(如公司历程、财务分析)完成证据收集与结论提炼。然后,系统以这些分析链为骨架,在全局层面进行组织与编排,生成大纲并分章节写作,同时通过一种“生成式检索”机制,在写作过程中动态嵌入数据和图片索引,以确保文本叙述、数据引用与图表呈现的一致性,从而在生成长篇报告时保持逻辑自洽。
实验评估结果显示,在涵盖公司研究与行业研究的基准测试中,FinSight在事实准确性、分析深度与呈现质量三项核心指标上均显著优于Gemini-2.5-Pro Deep Research与OpenAI Deep Research,综合评分达到8.09。在可视化维度上,其评分为9.00。系统生成的研报平均长度超过20000字,包含50余张图表与结构化数据引用,且报告质量随篇幅增长保持稳定。此外,该系统在AFAC 2025金融智能创新大赛挑战组的1289支队伍中获得了第一名。
该系统由中国人民大学高瓴人工智能学院的研究团队开发,相关论文与代码已公开。
发布时间:2025-12-26 19:50:15



评论 ( 0 )