Anthropic 发布 Claude 3.5 Sonnet:迈向自动化经济的一步

去年春天,Anthropic在向投资者的一次推介中表示,公司计划构建AI来驱动虚拟助手,这些助手可以自行执行研究、回复邮件和其他后台任务。这一目标被称为“下一代AI自我学习算法”,Anthropic相信,如果一切按计划进行,这种算法有朝一日可以自动化经济中的大部分工作。

Claude 3.5 Sonnet 发布

经过一段时间的努力,Anthropic于本周二发布了其Claude 3.5 Sonnet模型的升级版本。这一新模型可以理解和与任何桌面应用程序交互,通过一个新的“计算机使用”API(目前处于公开测试阶段),Claude 3.5 Sonnet可以模仿按键、按钮点击和鼠标手势,基本上模拟一个人坐在电脑前的操作。

技术细节

  • 屏幕观察与操作:Claude 3.5 Sonnet通过屏幕截图观察用户界面,并计算移动光标所需的像素数,以在正确位置点击。
  • API支持:开发者可以通过Anthropic的API、Amazon Bedrock和Google Cloud的Vertex AI平台尝试使用计算机功能。

应用案例

现有工具与竞争

  • 自动化工具:自动化PC任务的工具并不新鲜,许多公司提供此类工具,从传统的RPA供应商到新兴公司如Relay、Induced AI和Automat。
  • AI智能体竞赛:在开发AI智能体的竞争中,这一领域变得越来越拥挤。一些分析师认为,AI智能体可以为企业提供一条更容易的途径来实现其在AI上的投资回报。

具体应用

  • Replit:使用新3.5 Sonnet模型的早期版本创建了一个“自主验证器”,用于在应用程序构建过程中进行评估。
  • Canva:探索新模型如何支持设计和编辑过程。

安全与风险

潜在风险

  • 越狱技术:研究表明,即使受过滤器和安全措施保护的模型,也可能通过“越狱”技术执行有害任务。
  • 隐私与安全:Claude 3.5 Sonnet在基本操作(如滚动和缩放)上存在困难,可能会错过“短暂”的操作和通知。

安全措施

  • 限制访问:Anthropic采取措施防止滥用,例如不在用户的截图和提示上训练新的3.5 Sonnet,并防止模型在训练期间访问网络。
  • 分类器引导:开发分类器来“引导”3.5 Sonnet远离高风险操作,如在社交媒体上发帖、创建账户和与政府网站互动。
  • 数据保留:公司保留计算机使用捕获的任何截图至少30天,以备不时之需。

更便宜的模型

Claude 3.5 Haiku

  • 性能与成本:即将推出的Claude 3.5 Haiku将在某些基准测试中与Claude 3 Opus(Anthropic曾经的最先进模型)的表现相匹配,成本和速度与Claude 3 Haiku相同。
  • 应用场景:适合面向用户的产品、专门的子智能体任务,以及从大量数据中生成个性化体验。

未来展望

  • Claude 3.5 Opus:作为3 Opus的继任者,Anthropic表示将在未来分享更多信息。

Claude 3.5 Sonnet的发布标志着Anthropic在实现其自动化经济目标上迈出了重要一步。尽管存在潜在的安全风险,但Anthropic已经采取了一系列措施来确保模型的负责任使用。同时,更便宜的Claude 3.5 Haiku模型的推出,将进一步扩大AI智能体在各种应用场景中的适用性。希望这些技术的发展能够为社会带来更多的积极影响。

我们将24小时内回复。
取消