数据:
推理时间成功率提升,从5%提升到95%;DeepMind推出的Mind Evolution结合遗传算法,显著降低成本。
线索:
DeepMind的新研究表明,利用进化搜索策略和语言模型的结合,能够显著提升规划任务的成功率,这为未来在自然语言处理和人工智能领域的投资机会提供了契机。然而,相关技术的快速更新也可能带来市场竞争风险。
正文:
DeepMind的新研究关注推理时扩展(Inference-time scaling),推出了名为“Mind Evolution”的进化搜索策略,旨在优化大语言模型(LLMs)在规划和推理中的表现。通过该方法,使得Gemini 1.5 Flash的任务成功率从原来的5%提升至95%,并且使用的tokens数量仅为传统方法的几分之一。
Mind Evolution的一个优势是,它可以直接处理自然语言问题,而不需要将问题形式化,也就是说,传统方法中复杂的任务转化为机器可处理的形式的步骤可以省略,这样的创新很大程度上提升了适用范围。
该方法结合了两大关键组成部分:搜索算法和遗传算法。搜索算法帮助LLMs找到最佳推理路径,而遗传算法则通过迭代优化候选解决方案,以更好地满足任务目标。
在实验中,Mind Evolution的表现优异,尤其在复杂任务中,如旅行规划和会议规划,其任务成功率的提升显著。与传统方法Sequential Revisions+相比,Mind Evolution在使用率和成功率上都显示出更高的优势。此外,采用Mind Evolution技术后,未解决的问题甚至可以通过1.5Pro模型进一步提升成功率。
新任务“StegPoet”的测试结果也表明,Mind Evolution在需要逻辑推理与创造性表达的高度复杂任务中表现出色。综上所述,Mind Evolution通过有效结合广泛搜索与深度搜索,推动了模型在规划和推理方面的显著升级。
发布时间:
2025-01-23 16:52:12



评论 ( 0 )