谷歌将于12月推出一个名为“Project Jarvis”的AI系统,基于Gemini

The Information 报道,谷歌可能最早在12月预览其名为“Project Jarvis”的大型动作模型概念。这个项目旨在为用户执行各种任务,包括收集研究资料、购买产品和预订航班等。

关键特性

  1. 任务执行
    • 收集研究:Jarvis 可以从多个来源收集信息。
    • 购买产品:它可以处理在线交易,如购买商品。
    • 预订航班:Jarvis 可以协助预订航班和其他旅行安排。
  2. 浏览器集成
    • Jarvis 特别针对 Chrome 浏览器 进行了优化,只能在网络浏览器上使用。它通过截取和解释屏幕截图,然后点击按钮或输入文本,来自动化日常的基于网络的任务。
  3. 性能
    • 目前,Jarvis 在执行动作之间需要“几秒钟”的时间,但随着项目的进一步发展,这一延迟有望缩短。

技术支持

Jarvis 由谷歌 Gemini 的未来版本提供支持。Gemini 是一种先进的 AI 模型,能够理解和交互网络内容。

竞争格局

多家大型 AI 公司正在开发类似的工具:

  • 微软的 Copilot Vision:允许用户通过语音命令与其正在查看的网页进行互动。
  • 苹果智能系统:预计将在明年某个时候推出,能够了解屏幕上的内容并在多个应用程序中执行任务。
  • Anthropic 的 Claude:已经推出了一个“笨拙且容易出错”的测试版更新,可以代表用户使用计算机。
  • OpenAI:据报道也在研究类似的功能。

发布计划

虽然谷歌计划在12月展示 Jarvis,但 The Information 警告说,这一时间表可能会改变。谷歌正在考虑先将 Jarvis 发布给少数测试者,以帮助发现并解决潜在的错误。

影响与未来展望

  1. 用户体验
    • Jarvis 有望显著提高用户的生产力,通过自动化重复性和耗时的任务来节省时间和精力。
  2. 隐私与安全
    • 作为与个人数据交互的 AI 工具,隐私和安全将是至关重要的考虑因素。谷歌需要采取强有力的措施来保护用户信息。
  3. 市场竞争
    • Jarvis 的推出将进一步加剧 AI 驱动任务自动化领域的竞争。与其他公司的产品相比,其性能和用户体验将直接影响市场接受度。
  4. 用户采纳
    • 初期用户的反馈对于完善 Jarvis 至关重要。积极的用户体验将有助于其广泛推广。
我们将24小时内回复。
取消