文章目录[隐藏]
埃隆·马斯克的 xAI 公司为其 Grok AI 模型增加了图像理解功能,这一更新意味着 X 社交平台上的付费用户现在可以上传图像并向 AI 提问关于图像的问题。
更新内容
- 图像理解能力:
- 功能介绍:Grok 现在可以理解和回答关于上传图像的问题。
- 应用场景:用户可以上传图片,询问图片中的内容、对象识别、场景描述等。
- 示例:马斯克表示,Grok 甚至可以使用新的图像理解功能解释笑话的含义。
- 早期阶段:
- 当前状态:这项功能目前处于早期阶段,但马斯克表示它将“迅速改进”。
发布历史
- Grok-2 模型:今年八月,xAI 发布了 Grok-2 模型,这是聊天机器人的增强版本,包括使用 Black Forest Labs 的 FLUX.1 模型进行图像生成的能力。
- 多模态理解能力:xAI 当时表示,未来的发布将增加 Grok 在 X 上的多模态理解能力,以及通过开发者 API 提供的模型。
未来计划
- 文档理解:马斯克回应了一位用户的批评,表示 Grok 可能很快也能理解文档,如 PDF 文件。他强调:“不会太久。”
- 快速开发:马斯克声称 xAI 正在几个月内完成其他人需要几年才能完成的事情。
X 社交平台的功能增强
- Radar 工具:本月早些时候,X 推出了一项名为 Radar 的新工具,供 Premium+ 订阅者观察实时趋势并提供对话洞察。
- 吸引用户:这些功能的增加旨在使 X 服务更具吸引力,特别是对付费用户。