Anthropic 发布 Claude 3.5 Sonnet：迈向自动化经济的一步

文章目录[隐藏]

Claude 3.5 Sonnet 发布
应用案例
安全与风险
更便宜的模型

去年春天，Anthropic在向投资者的一次推介中表示，公司计划构建AI来驱动虚拟助手，这些助手可以自行执行研究、回复邮件和其他后台任务。这一目标被称为“下一代AI自我学习算法”，Anthropic相信，如果一切按计划进行，这种算法有朝一日可以自动化经济中的大部分工作。

Claude 3.5 Sonnet 发布

经过一段时间的努力，Anthropic于本周二发布了其Claude 3.5 Sonnet模型的升级版本。这一新模型可以理解和与任何桌面应用程序交互，通过一个新的“计算机使用”API（目前处于公开测试阶段），Claude 3.5 Sonnet可以模仿按键、按钮点击和鼠标手势，基本上模拟一个人坐在电脑前的操作。

技术细节：

屏幕观察与操作：Claude 3.5 Sonnet通过屏幕截图观察用户界面，并计算移动光标所需的像素数，以在正确位置点击。
API支持：开发者可以通过Anthropic的API、Amazon Bedrock和Google Cloud的Vertex AI平台尝试使用计算机功能。

应用案例

现有工具与竞争：

自动化工具：自动化PC任务的工具并不新鲜，许多公司提供此类工具，从传统的RPA供应商到新兴公司如Relay、Induced AI和Automat。
AI智能体竞赛：在开发AI智能体的竞争中，这一领域变得越来越拥挤。一些分析师认为，AI智能体可以为企业提供一条更容易的途径来实现其在AI上的投资回报。

具体应用：

Replit：使用新3.5 Sonnet模型的早期版本创建了一个“自主验证器”，用于在应用程序构建过程中进行评估。
Canva：探索新模型如何支持设计和编辑过程。

安全与风险

潜在风险：

越狱技术：研究表明，即使受过滤器和安全措施保护的模型，也可能通过“越狱”技术执行有害任务。
隐私与安全：Claude 3.5 Sonnet在基本操作（如滚动和缩放）上存在困难，可能会错过“短暂”的操作和通知。

安全措施：

限制访问：Anthropic采取措施防止滥用，例如不在用户的截图和提示上训练新的3.5 Sonnet，并防止模型在训练期间访问网络。
分类器引导：开发分类器来“引导”3.5 Sonnet远离高风险操作，如在社交媒体上发帖、创建账户和与政府网站互动。
数据保留：公司保留计算机使用捕获的任何截图至少30天，以备不时之需。

更便宜的模型

Claude 3.5 Haiku：

性能与成本：即将推出的Claude 3.5 Haiku将在某些基准测试中与Claude 3 Opus（Anthropic曾经的最先进模型）的表现相匹配，成本和速度与Claude 3 Haiku相同。
应用场景：适合面向用户的产品、专门的子智能体任务，以及从大量数据中生成个性化体验。

未来展望：

Claude 3.5 Opus：作为3 Opus的继任者，Anthropic表示将在未来分享更多信息。

Claude 3.5 Sonnet的发布标志着Anthropic在实现其自动化经济目标上迈出了重要一步。尽管存在潜在的安全风险，但Anthropic已经采取了一系列措施来确保模型的负责任使用。同时，更便宜的Claude 3.5 Haiku模型的推出，将进一步扩大AI智能体在各种应用场景中的适用性。希望这些技术的发展能够为社会带来更多的积极影响。

AI·新世界