微软发布多代理基础设施Magnetic-One

随着企业越来越多地部署AI代理来处理复杂的多步骤任务,管理和协调这些代理成为一个关键挑战。微软最近发布了一个名为Magnetic-One的新多代理基础设施,旨在解决这一问题。Magnetic-One允许一个AI模型为多个辅助代理提供动力,这些代理共同完成不同场景中的复杂任务。微软将Magnetic-One称为通用代理系统,认为它能够“完全实现长期以来代理系统增强我们生产力、改变我们生活的愿景”。

Magnetic-One框架概述

Magnetic-One依赖于一个名为Orchestrator的代理,该代理负责指导其他四个代理,包括Websurfer、FileSurfer、Coder和ComputerTerminal。这些代理各自承担不同的任务,共同完成复杂的多步骤任务。

  1. Orchestrator:负责管理和指导其他代理,制定任务计划并跟踪任务进度。Orchestrator创建任务账本,跟踪工作流程,并构建进度账本,自我反思任务进度并检查任务是否完成。如果任务停滞不前,Orchestrator可以重新规划任务。
  2. Websurfer:可以命令基于Chromium的浏览器,导航到网站或执行Web搜索,点击和输入,类似于Anthropic最近发布的Computer Use,并总结内容。
  3. FileSurfer:读取本地文件列表,目录和文件夹。
  4. Coder:编写代码,分析来自其他代理的信息并创建新工件。
  5. ComputerTerminal:提供一个控制台,用于执行Coder代理的程序。

工作原理

Magnetic-One的工作流程如下:

  1. 任务规划:Orchestrator首先计划如何处理任务,创建任务账本,跟踪工作流程。
  2. 任务分配:Orchestrator将任务分配给相应的代理,例如,Websurfer可以用于Web搜索,FileSurfer可以用于文件操作,Coder可以用于编写代码。
  3. 任务执行:各个代理执行分配的任务,并将结果返回给Orchestrator。
  4. 进度跟踪:Orchestrator构建进度账本,自我反思任务进度并检查任务是否完成。
  5. 错误处理:如果任务停滞不前或出现错误,Orchestrator可以重新规划任务或重新分配代理。

示例任务

微软提供的示例任务包括:

  • 描述S&P 500的趋势
  • 查找和导出缺失的引用
  • 订购沙威玛

这些任务看似平凡,但涉及多个步骤和不同类型的操作,展示了Magnetic-One的灵活性和能力。

技术细节

  • 模型选择:虽然微软使用OpenAI的GPT-4o开发了Magnetic-One,但该框架对LLM不可知。开发人员可以为Orchestrator代理部署一个推理LLM,并为其他代理部署其他LLM或小型语言模型的混合。
  • 实验配置:微软的研究人员使用不同的Magnetic-One配置进行了实验,例如,使用OpenAI 01-preview作为Orchestrator的外循环和Coder,而其他代理继续使用GPT-4o。

评估工具

与Magnetic-One的发布相结合,微软还发布了一个名为AutoGenBench的开源代理评估工具,用于测试代理系统。AutoGenBench构建在其之前发布的用于多代理通信和协作的Autogen框架之上,帮助研究人员和开发人员评估代理系统的性能和可靠性。

未来展望

随着AI代理的普及,管理这些代理的工作流程变得越来越重要。Magnetic-One提供了一个强大的多代理基础设施,有助于企业和个人更高效地完成复杂任务。然而,AI代理的部署仍然处于早期阶段,确定最佳的多代理框架将继续是一个持续的实验。微软的这一创新为未来的发展奠定了基础,但仍有很大的改进空间。(来源

我们将24小时内回复。
取消