Multi-Agent Design: Optimizing Agents with Better Prompts and Topologies

基本信息 标题: Multi-Agent Design: Optimizing Agents with Better Prompts and Topologies 作者: Han Zhou(通讯作者)、Ruoxi Sun、Hamid Palangi、Shariq Iqbal、Ivan Vulić、Anna Korhonen和Sercan Ö. Arık。 作者单位: Google和剑桥大学 期刊/会议: ArXiv 发表年份: 2025.02.04 DOI: 2502.02533 开源地址: Github 关键词: Multi-Agent System, Large Language Models 研究问题 (Research Questions) 大语言模型,作为多个相互交互协作的智能体,可以解决复杂任务。这些智能体通过声明其功能的提示词以及协调智能体间交互的拓扑结构进行编程。本文所研究的主要问题是优化多智能体系统中的提示词以及智能体的拓扑结构。 研究背景 (Background) 尽管最近的研究探讨了自动化智能体设计各个方面,但在理解哪些因素对改进MAS性能最为关键方面仍存在差距。例如,DSPy自动化了设计示例以改进提示编程的过程。J Li(More agents is all you need作者)提出通过扩大多数投票中的代理数量来优化MAS。ADAS通过基于LLM的元代理编程代码表达的新拓扑。AFlow在预定义操作集中使用蒙特卡洛树搜索来寻找更好的拓扑。然而,包括提示词和拓扑在内的多个设计空间之间的相互作用仍然不明确。 核心贡献 (Key Contributions) 深入分析了影响基于LLM的MAS性能的设计因素,强调了prompt的重要性,并确定了有影响力的拓扑结构。 提出了一种名为Mass的新型多阶段优化器,通过在具有影响力的搜索空间中交错优化prompt和拓扑结构来自动化MAS设计。 大量数据在各种评估基准上显示出显著的性能提升,为构建有效的未来多智能体系统提供了指导。 设计多智能体系统(Designing Multi-Agent Systems) 作者认为MAS的设计可以分为两个层级:块级设计(Block-level)和工作流编排(Workflow-level orchestration)。对于块级,目标是设计单个智能体,通过更好的提示词设计最好的提示词来表现出特定的角色。对于工作流编排,它的优化涉及要包含智能体的类型和数量,以及如何以最有效的方式编排他们,这被称为拓扑优化。 $\mathcal{W}^{*}(a)=\arg\max\mathbb{E}_{(x,y)\sim\mathcal{D}}[f(\mathcal{W}(a)(x)),y]$ 块级:智能体的提示词设计(Block-level: Prompt Design for Agents) 对于块级,对下游任务影响最主要的是prompt,它定义了智能体的角色(例如,“You are an expert in reflecting on errors…”),提供额外的指令来塑造其行为(例如,“You should think step by step…”)以及可选地包含少量示例(zero-shot/one-shot/few-shot)来指导智能体的回复。比如,一种SOAT提示词优化器同时搜索指令和少量示例,其中示例是从模型自身在验证集上的正确预测中引导出来的,基于验证指标。基于这些示例,提示词优化器会为指令提出一些候选方案,并提供数据集摘要或各种提示词以提高候选方案的多样性。然后指令和示例会被联合优化。...

June 19, 2025 · 7 min · 1308 words · Rex