【2023年10月6日AI晚报】微软 DALL·E 3 禁止生成“世贸”、“双子塔”主题图片;谷歌助手将集成 Bard AI 工具

[t-info icon='']AI·快讯[/t-info]

1、Adobe 预热 Stardust:AI 识别和编辑照片中对象

Adobe 计划今年 10 月 10-12 日举办 MAX 创新大会,官方已经提前预热了名为 Project Stardust 的 AI 照片编辑器,可以准确识别和编辑照片中的对象。Adobe 近日提前放出了一段预热视频,展示了 Stardust 强大的 AI 编辑能力,例如用户可以打开没有图层的单张照片,选中照片中的手提箱,该工具就会自动将其识别为单独的对象,允许用户移动或者删除;此外用户还可以通过 AI 调整握持的物品(演示中为一束花),并动态调整手指位置。

2、谷歌助手将集成 Bard AI 工具

谷歌宣布,将很快发布一款由 Bard 驱动的虚拟助手,帮助用户处理更复杂的任务,这也是首个集成到手机中的同类产品。这款名为“Google Assistant with Bard”的新产品将很快进入测试阶段,然后在未来几个月内向公众推出。据介绍,这款谷歌助手可以帮助安卓和谷歌设备的用户完成任务和查找信息,它将具备聊天机器人 Bard 的一些功能。(来源:IT之家

3、《命运 2》开发商 Bungie 认可 AI 辅助游戏开发,已录取相关工程师

《命运 2》开发商 Bungie 近来正在同时开发多款作品,IT之家此前曾报道,这家开发商此前聘请了多家外包工作室协助旗下游戏制作。而目前 Bungie 开始将目光放在了 AI 上。Bungie 日前在 TheGamePost 招聘网站上开始招聘“AI 首席工程师”,该职位要求应聘者了解并熟练使用 AI 生产工具,并要求应聘者开发一系列生成式 AI 模型,让开发人员利用这些 AI 模型加快工作流程。IT之家经过查询得知,目前该职位招聘已经不再接受申请,这意味着已经有人被正式录取。(来源:IT之家

4、为解决“缺芯”问题,消息称 OpenAI 正探索自研 AI 芯片

据路透社今日报道,消息人士透露称 OpenAI 正在探索制造自己的 AI 芯片,并已开始评估“潜在的”收购目标。熟悉内情的人士表示,至少从去年开始,OpenAI 就已讨论各种方案,以解决其 AI 芯片短缺的问题。这些选择包括自研 AI 芯片、与英伟达等芯片制造商展开更紧密合作、实现供应商多元化等诸多方面。不过,据路透社最近的“内部讨论”,OpenAI 尚未决定持续推进。同时,OpenAI 方面也拒绝就此事发表评论。

5、微软 DALL-E 3 禁止生成“世贸”、“双子塔”主题图片,官方回应“防止产生有害内容”

综合 The Verge 等媒体报道,日前一些使用微软 DALL-E 3 工具的用户创作出“人物或动漫角色驾驶飞机撞向两座高楼(通常指“双子塔”,Twin Tower)”的图片,引起不小争议。在微软公关总监 Caitlin Roulston 给 The Verge 的一封电子邮件声明中回应称:“公司正计划改进其系统,以帮助防止产生有害内容”。(来源:IT之家

6、三星将把 Tizen 系统引入更多家电,可向其他高性能设备请求 AI 服务

Tizen 在三星智能家居愿景中发挥着核心作用。三星智能电视、智能显示器、Family Hub 冰箱等产品均由 Tizen 提供支持。在今日的 SDC23 三星开发者大会上,该公司宣布将把 Tizen 引入更多设备,包括带有 7 英寸屏幕的家用电器。它还详细介绍了一种创新的 AI 解决方案,该解决方案将使这些设备变得更加智能。(来源:IT之家

7、研究表明:为 AI 生成图像添加的数字水印可被轻易破解

据外媒 Engadget、Wired 等报道,美国马里兰大学的一个研究小组对 AI 生成内容的“数字水印”技术可靠性进行研究,发现这一技术可被轻易破解。该校计算机科学教授 Soheil Feizi 面对 AI 生成图像的水印现状时直言不讳:“目前我们没有任何可靠的水印技术,我们破解了所有的水印。”在测试过程中,研究人员可轻松避开现有的水印方法,并发现在非 AI 生成的图像上添加“假水印”更为容易。同时,该团队还开发出了一种“几乎无法”从图像中去除的水印技术,且不会完全损害图像的知识产权。(来源:IT之家

8、StreamingLLM 框架问世,号称“可让大模型处理无限长度文本”

麻省理工学院联合 Meta AI 的研究人员日前开发了一款名为 StreamingLLM 的框架,为大语言模型可能遇到的 RAM 与泛化问题提出了一系列解决方案,号称能够“让语言模型处理无限长度的文本内容”。StreamingLLM 的研究重点,是想解决实现流式语言模型(Efficient Streaming Language Models,ESLM)的障碍,特别是“长时间互动的多轮对话场景”中可能出现的问题。(来源:IT之家

论文地址:https://arxiv.org/abs/2309.17453

GitHub地址:https://github.com/mit-han-lab/streaming-llm