据 The Information 报道,谷歌可能最早在12月预览其名为“Project Jarvis”的大型动作模型概念。这个项目旨在为用户执行各种任务,包括收集研究资料、购买产品和预订航班等。
关键特性
- 任务执行:
- 收集研究:Jarvis 可以从多个来源收集信息。
- 购买产品:它可以处理在线交易,如购买商品。
- 预订航班:Jarvis 可以协助预订航班和其他旅行安排。
- 浏览器集成:
- Jarvis 特别针对 Chrome 浏览器 进行了优化,只能在网络浏览器上使用。它通过截取和解释屏幕截图,然后点击按钮或输入文本,来自动化日常的基于网络的任务。
- 性能:
- 目前,Jarvis 在执行动作之间需要“几秒钟”的时间,但随着项目的进一步发展,这一延迟有望缩短。
技术支持
Jarvis 由谷歌 Gemini 的未来版本提供支持。Gemini 是一种先进的 AI 模型,能够理解和交互网络内容。
竞争格局
多家大型 AI 公司正在开发类似的工具:
- 微软的 Copilot Vision:允许用户通过语音命令与其正在查看的网页进行互动。
- 苹果智能系统:预计将在明年某个时候推出,能够了解屏幕上的内容并在多个应用程序中执行任务。
- Anthropic 的 Claude:已经推出了一个“笨拙且容易出错”的测试版更新,可以代表用户使用计算机。
- OpenAI:据报道也在研究类似的功能。
发布计划
虽然谷歌计划在12月展示 Jarvis,但 The Information 警告说,这一时间表可能会改变。谷歌正在考虑先将 Jarvis 发布给少数测试者,以帮助发现并解决潜在的错误。
影响与未来展望
- 用户体验:
- Jarvis 有望显著提高用户的生产力,通过自动化重复性和耗时的任务来节省时间和精力。
- 隐私与安全:
- 作为与个人数据交互的 AI 工具,隐私和安全将是至关重要的考虑因素。谷歌需要采取强有力的措施来保护用户信息。
- 市场竞争:
- Jarvis 的推出将进一步加剧 AI 驱动任务自动化领域的竞争。与其他公司的产品相比,其性能和用户体验将直接影响市场接受度。
- 用户采纳:
- 初期用户的反馈对于完善 Jarvis 至关重要。积极的用户体验将有助于其广泛推广。