xAI 为 Grok AI 模型增添图像理解能力

埃隆·马斯克的 xAI 公司为其 Grok AI 模型增加了图像理解功能,这一更新意味着 X 社交平台上的付费用户现在可以上传图像并向 AI 提问关于图像的问题。

更新内容

  1. 图像理解能力
    • 功能介绍:Grok 现在可以理解和回答关于上传图像的问题。
    • 应用场景:用户可以上传图片,询问图片中的内容、对象识别、场景描述等。
    • 示例:马斯克表示,Grok 甚至可以使用新的图像理解功能解释笑话的含义。
  2. 早期阶段
    • 当前状态:这项功能目前处于早期阶段,但马斯克表示它将“迅速改进”。

发布历史

  • Grok-2 模型:今年八月,xAI 发布了 Grok-2 模型,这是聊天机器人的增强版本,包括使用 Black Forest Labs 的 FLUX.1 模型进行图像生成的能力。
  • 多模态理解能力:xAI 当时表示,未来的发布将增加 Grok 在 X 上的多模态理解能力,以及通过开发者 API 提供的模型。

未来计划

  • 文档理解:马斯克回应了一位用户的批评,表示 Grok 可能很快也能理解文档,如 PDF 文件。他强调:“不会太久。”
  • 快速开发:马斯克声称 xAI 正在几个月内完成其他人需要几年才能完成的事情。

X 社交平台的功能增强

  • Radar 工具:本月早些时候,X 推出了一项名为 Radar 的新工具,供 Premium+ 订阅者观察实时趋势并提供对话洞察。
  • 吸引用户:这些功能的增加旨在使 X 服务更具吸引力,特别是对付费用户。
我们将24小时内回复。
取消