数据:
清华大学发布生成式时序大模型日晷,支持万亿级时间点的预测,具备毫秒级推理速度。
线索:
生成式时序大模型“日晷”的发布为时序预测领域带来了诸多创新,比如针对非确定性预测的流匹配预测损失函数和零样本预测的预训练模型,为投资数据分析、金融科技及物联网等行业提供了新的技术手段与应用前景,具有广阔的市场需求。但也伴随着潜在风险,如新技术的推广应用和市场接受度不确定。
正文:
清华大学软件学院近日发布了生成式时序大模型“日晷”,这一模型的创新在于其告别了传统的离散化局限,可以无损处理连续值,采用流匹配生成预测,解决了预训练模式的坍塌问题,并支持非确定性的概率预测,为决策过程提供了动态支持。同时,这项研究成果在2025年国际机器学习大会(ICML)上被接纳为口头报告。
“日晷”模型的强大之处在于其在时序预测领域的表现。凭借支持零样本预测的能力,该模型构建了首个规模达到万亿(10^12)时间点的高质量时序数据集“TimeBench”,该数据集涵盖气象、金融、交通、能源及物联网等领域,样本频率从小时到日度不等。模型因为不需要特别微调,能够在多个预测榜单中取得优异成绩,表现出毫秒级的推理速度。
此次发布的时序大模型,其使用的预测损失函数基于流匹配,允许根据历史序列生成多条预测轨迹,解决了时序数据中的非确定性问题。与其它模型相比,该模型在进行复杂数据分析时,表现出更强的灵活性与适应性。
此外,“日晷”还结合了可扩展的Transformer结构,采用重归一化、分块嵌入以及多分块预测等技术,优化了时序数据的处理效率。借助所提出的“时间流预测损失”(TimeFlow Loss),模型能够在无需引入任何概率先验的情况下,扩展其对复杂分布的建模能力。
“日晷”现已在HuggingFace上开源,用户可以轻松调用该模型进行零样本预测。随着该技术的不断完善和推广,预计将在多个行业中广泛应用,成为决策过程中不可或缺的工具。
发布时间:
2025-06-20 16:28:40
评论 ( 0 )