随着企业越来越多地部署AI代理来处理复杂的多步骤任务,管理和协调这些代理成为一个关键挑战。微软最近发布了一个名为Magnetic-One的新多代理基础设施,旨在解决这一问题。Magnetic-One允许一个AI模型为多个辅助代理提供动力,这些代理共同完成不同场景中的复杂任务。微软将Magnetic-One称为通用代理系统,认为它能够“完全实现长期以来代理系统增强我们生产力、改变我们生活的愿景”。
Magnetic-One框架概述
Magnetic-One依赖于一个名为Orchestrator的代理,该代理负责指导其他四个代理,包括Websurfer、FileSurfer、Coder和ComputerTerminal。这些代理各自承担不同的任务,共同完成复杂的多步骤任务。
- Orchestrator:负责管理和指导其他代理,制定任务计划并跟踪任务进度。Orchestrator创建任务账本,跟踪工作流程,并构建进度账本,自我反思任务进度并检查任务是否完成。如果任务停滞不前,Orchestrator可以重新规划任务。
- Websurfer:可以命令基于Chromium的浏览器,导航到网站或执行Web搜索,点击和输入,类似于Anthropic最近发布的Computer Use,并总结内容。
- FileSurfer:读取本地文件列表,目录和文件夹。
- Coder:编写代码,分析来自其他代理的信息并创建新工件。
- ComputerTerminal:提供一个控制台,用于执行Coder代理的程序。
工作原理
Magnetic-One的工作流程如下:
- 任务规划:Orchestrator首先计划如何处理任务,创建任务账本,跟踪工作流程。
- 任务分配:Orchestrator将任务分配给相应的代理,例如,Websurfer可以用于Web搜索,FileSurfer可以用于文件操作,Coder可以用于编写代码。
- 任务执行:各个代理执行分配的任务,并将结果返回给Orchestrator。
- 进度跟踪:Orchestrator构建进度账本,自我反思任务进度并检查任务是否完成。
- 错误处理:如果任务停滞不前或出现错误,Orchestrator可以重新规划任务或重新分配代理。
示例任务
微软提供的示例任务包括:
- 描述S&P 500的趋势
- 查找和导出缺失的引用
- 订购沙威玛
这些任务看似平凡,但涉及多个步骤和不同类型的操作,展示了Magnetic-One的灵活性和能力。
技术细节
- 模型选择:虽然微软使用OpenAI的GPT-4o开发了Magnetic-One,但该框架对LLM不可知。开发人员可以为Orchestrator代理部署一个推理LLM,并为其他代理部署其他LLM或小型语言模型的混合。
- 实验配置:微软的研究人员使用不同的Magnetic-One配置进行了实验,例如,使用OpenAI 01-preview作为Orchestrator的外循环和Coder,而其他代理继续使用GPT-4o。
评估工具
与Magnetic-One的发布相结合,微软还发布了一个名为AutoGenBench的开源代理评估工具,用于测试代理系统。AutoGenBench构建在其之前发布的用于多代理通信和协作的Autogen框架之上,帮助研究人员和开发人员评估代理系统的性能和可靠性。
未来展望
随着AI代理的普及,管理这些代理的工作流程变得越来越重要。Magnetic-One提供了一个强大的多代理基础设施,有助于企业和个人更高效地完成复杂任务。然而,AI代理的部署仍然处于早期阶段,确定最佳的多代理框架将继续是一个持续的实验。微软的这一创新为未来的发展奠定了基础,但仍有很大的改进空间。(来源)