【2023年11月16日AI晚报】WPS AI开启公测，面向用户开放体验；OPPO推出安第斯大模型AndesGPT

文章目录[隐藏]

[t-primary icon='']AI·快讯[/t-primary]
[t-success icon='']AI·发布会[/t-success]
- 1、微软加入自定义GPT大战！Bing Chat改名，自研芯片登场，连甩13项AI升级

[t-primary icon='']AI·快讯[/t-primary]

1、谷歌天气预报模型GraphCast登刊Science

11月14日，国际顶刊《科学》（Science）刊发了谷歌DeepMind研究团队的一篇论文，该论文描述了天气预报模型GraphCast，它能在一分钟内预测全球0.25°分辨率下10天内的数百个天气变量。在1380个验证目标中，GraphCast在90%的目标上优于欧洲中期天气预报中心（ECMWF）的高分辨率预报（HRES），后者被认为是全球最准确的天气预报模型之一。研究团队还将GraphCast的性能与基于ML的顶级天气预报模型盘古大模型进行了比较，发现GraphCast在252个目标中的99.2%上都表现更佳。

论文地址：https://www.science.org/doi/10.1126/science.adi2336

2、微软等开发基于GPT-4V的Agent与手机交互

11月13日，来自加州大学圣地亚哥分校、微软等机构的研究团队发表论文，开发了一种基于GPT-4V的Agent——MM-Navigator，用于开展智能手机用户界面的导航任务。研究表明无需任何训练，GPT-4V就能直接像人类一样与智能手机进行交互，完成各种指定命令。根据测试，GPT-4V在iPhone上完成类似“在50-100美元的预算内购买一个打奶泡的工具”任务的成功率可达75%。在安卓机上的测试整体来看，MM-Navigator在执行安装、购物等任务中的总体表现最高得分为52.96%，Llama 2、PaLM 2和ChatGPT等基线模型最高39.6%。

论文地址：https://arxiv.org/abs/2311.07562

3、WPS AI开启公测，面向用户开放体验

16日，金山办公宣布旗下具备大语言模型能力的人工智能办公应用WPS AI开启公测，AI功能面向全体用户陆续开放体验。金山办公CEO章庆元表示，金山办公将WPS AI定位为大语言模型的应用方，锚定AIGC（内容创作）、Copilot（智慧助理）、Insight（知识洞察）三个战略方向发展。（来源：快科技）

地址：https://ai.wps.cn

4、OPPO推出安第斯大模型AndesGPT

OPPO推出自主训练、个性专属的大模型安第斯大模型——AndesGPT。据介绍，AndesGPT拥有对话增强、个人专属和端云协同三大技术特征，及知识、记忆、工具与创作四大核心能力。据悉，全新的小布助手已经接入AndesGPT大模型，支持通话助手，智能摘要功能可以提取通话记录的重要内容，还可以搞定复杂手机操作，帮你生成定制内容、总结摘要等等。

5、微软推出首款AI自研芯片，力求避免供应链瓶颈

微软发布了首款自研人工智能芯片和云计算处理器，试图在竞争日益激烈的AI计算市场掌握更多技术并增加产品供应。该公司还发布可以让客户为自己设计AI助手的新软件。微软周三在西雅图举行的年度Ignite技术大会上发布了Maia 100芯片，这款AI芯片将为该公司Azure云客户提供一种新的方式来开发和运行生成内容的AI程序。负责Azure芯片部门的副总裁表示，微软已在用Bing和Office AI产品测试该芯片。

6、全新雅虎搜索将于 2024 年上线，未来将推更多 AI 与高级功能

在 SMX 搜索引擎营销大会上，雅虎（Yahoo!）高级副总裁兼总经理 Brian Provost 表示，新雅虎将于 2024 年的头几周推出。“我们预计雅虎搜索团队将在 2024 年的前几周（也许最快几个月后）推出更多基本功能，未来还会继续推出更多人工智能和高级功能。”

7、DeepL 在 AI 翻译领域占优

翻译是一门古老的艺术——也许和文明本身一样古老。古老的根源并没有阻碍创新，生成式 AI 的兴起引发了翻译技术的井喷式增长。数据提供商 Statista 预测，AI 翻译的全球市场将从 2023 年的约 50 亿美元增长到 2030 年的约 120 亿美元。Gartner 预测，到 2025 年人类翻译者四分之一的工作量将是审阅和编辑机器翻译文本。在这一波 AI 翻译浪潮中，德国公司 DeepL 在 Google 和 Facebook 等强大竞争对手中间脱颖而出。DeepL 自 2017 年创办以来成长迅速，可能是过去 15 年翻译领域最成功的科技公司。它支持翻译 30 种语言，有逾两万家企业客户，其中包括爱思唯尔 (Elsevier) 和富士通 (Fujitsu)等知名公司，今年 1 月它的估值达到了 10 亿美元。尽管竞争日益激烈，DeepL 仍然对未来保持乐观，相信对翻译质量的重视能带来新机遇。

8、英伟达发布基于微软 Azure 的生成式 AI Foundry 服务， SAP SE、Amdocs 和 Getty Images 率先采用

微软 Ignite 2023 大会已于今天拉开帷幕，英伟达发布了基于微软智能云 Microsoft Azure 的 AI 工坊（AI foundry ）服务，旨在帮助企业和初创公司在 Azure 上开发、调优和部署其自定义生成式 AI 应用。据介绍，这项 NVIDIA AI foundry 服务整合了 NVIDIA AI Foundation Models、NVIDIA NeMo 框架和工具，以及 NVIDIA DGX 云 AI 超算服务三大要素。

英伟达表示，它可以为企业提供创建自定义生成式 AI 模型的端到端解决方案，并且支持企业使用 NVIDIA AI Enterprise 软件部署其定制模型，以支持生成式 AI 应用，包括智能搜索、摘要和内容生成。目前，SAP SE、Amdocs 和 Getty Images 三大厂商已率先使用了这项服务来构建其自定义 AI 模型。除此之外，英伟达还宣布将更新 TensorRT-LLM，添加 OpenAI 的 Chat API 支持，并增强 DirectML 功能，改善 Llama 2 和 Stable Diffusion 等 AI 模型的性能。

9、12 月上线，微软发布 Personal Voice：最短 60 秒实现用户自建 AI 音频

微软 Ignite 2023 大会已经拉开帷幕，微软 Azure AI 服务部门在本次活动中推出 Personal Voice 功能，可以使用自己的声音来创建 AI 音频。微软在博文中写道：“准备用于创建 AI 语音的训练样本可能很困难或成本高昂。不过通过 Personal Voice，最短可以在 60 秒内，让用户自建和其声音相近的 AI 声音”。此功能将率先在西欧、美国东部和东南亚地区上线，公共预览版将于 12 月 1 日上线。

10、英伟达预告新版 TensorRT-LLM：推理能力飙升 5 倍、8GB 以上显卡可本地运行，支持 OpenAI 的 Chat API

微软 Ignite 2023 大会已于今天拉开帷幕，英伟达高管出席本次大会并宣布更新 TensorRT-LLM，添加了对 OpenAI Chat API 的支持。英伟达面向数据中心和 Windows PC，推出 Tensor RT-LLM 开源库。最大的特点是，如果 Windows PC 配备英伟达 GeForce RTX GPU，TensorRT-LLM 可以让 LLM 在 Windows PC 上的运行速度提高四倍。（来源：IT之家）

11、微软推出网页版 Copilot，仅限 Edge 等基于 Chromium 的浏览器访问

微软 Ignite 2023 大会于今天拉开帷幕，微软推出了专门的网页版 Copilot，以便于 Windows 和 macOS 用户，体验 Copilot 的 AI 聊天服务，此前仅限于微软的各种软件应用访问使用。值得注意的是，微软官方表示仅限于使用 Edge 或者其它基于 Chromium 的浏览器，使用 Firefox 访问会跳出不支持选项。（来源：IT之家）

地址：https://copilot.microsoft.com

12、微软发布 Windows AI Studio，在 Win11 上简化开发 AI 应用体验

微软在今天开幕的 Ignite 2023 大会中，面向开发者推出了全新的 “Windows AI Studio”体验，在 Win11 系统上可以简化、加速 AI 应用的开发工作。除了简化构建 AI 体验的设置过程外，Windows AI Studio 还将突出显示专门针对 GPU 和 NPU 优化的 AI 模型，只是该功能会后续推出。（来源：IT之家）

13、微软宣布 Bing Chat 及其 Enterprise 企业版更名为 Copilot

在今天的 Microsoft Ignite 2023 开发者大会上，微软宣布 Bing Chat 及其企业高级版 Bing Chat for Enterprise 正式更名为 Copilot！微软通讯总监 Caitlin Roulston 表示，“将‘Bing Chat Enterprise’更名为‘Copilot’反映了我们为消费者和商业客户打造统一的 Copilot 体验的愿景”。（来源：IT之家）

14、ChatGPT 代码解释器被发现存在漏洞，黑客利用可窃取你的数据

OpenAI 近日为 ChatGPT 推出了全新的代码解释器（Code Interpreter）工具，可以帮助程序员调试、完善代码编程工作。不过根据 Johann Rehberger 网络安全专家、Tom's Hardware 等多家国外媒体报道，由于该代码解释器工具可以处理任何电子表格文件，并能以图表的形式分析和呈现数据，黑客可以欺骗 ChatGPT 聊天机器人，让其执行来自第三方 URL 的指令。（来源：IT之家）

15、微软推出 Copilot Studio 工具、为 Copilot for Microsoft 365 引入新功能

微软在近日召开的 Ignite 2023 活动中，介绍展示了 Microsoft Copilot 套件的一系列增强功能。这个创新工具提供了一种低代码（low-code）方法，支持为 Microsoft 365 定制 Copilot，并创建独立的 Copilot 应用。（来源：IT之家）

16、谷歌发布 Mirasol：30 亿参数，将多模态理解扩展到长视频

谷歌公司近日发布新闻稿，介绍了小型人工智能模型 Mirasol，可以回答有关视频的问题并创造新的记录。AI 模型目前很难处理不同的数据流，如果要让 AI 理解视频，需要整合视频、音频和文本等不同模态的信息，这大大增加了难度。谷歌和谷歌 Deepmind 的研究人员提出了新的方法，将多模态理解扩展到长视频领域。（来源：IT之家）

17、TPC 联盟成立：目标万亿以上参数 AI 模型，推进科学发现

业内领先的科研机构、美国国家超级计算中心和诸多 AI 领域龙头公司，近日联合组建了万亿参数联盟（Trillion Parameter Consortium，简称 TPC）。TPC 联盟由来自全球实验室、科研机构、学术界和工业界的科学家组成，目标是共同推进用于科学发现的 AI 模型，特别关注一万亿或更多参数的巨型模型。TPC 联盟目前已经正在开发可扩展模型架构和训练策略，组织和整理用于模型训练的科学数据，为当前和未来的百万兆次级计算平台优化 AI 库。（来源：IT之家）

18、微软公布 Text To Speech Avatar AI 工具：可制作虚拟 3D 数字人、基于 Azure 平台

微软在 Ignite 大会中，为 Azure AI Speech 推出了一项名为“Azure AI Speech text to speech (TTS) avatar”的 AI 工具，号称可以生成人类逼真虚拟化身（数字人），目前这款工具已经开放给大众预览试用。微软表示，用户使用 Azure AI Speech text to speech (TTS) avatar，可以建立基于“输入文字说出内容”的虚拟化身，并结合现实人物照片训练，建立以真实人物为基础的“互动式聊天机器人”，可用于企业的营销、业务或客户服务等场景。（来源：IT之家）

19、Adobe 演示 Sound Lift 工具：可分层人声和噪音音轨

Adobe 公司近日宣布正在开发名为 Project Sound Lift 的全新音频工具，可以解构录音内容，像图片一样分解成不同的声音层。Sound Lift 工具主要采用 AI 技术，可以分开掌声等嘈杂的背景声音和某人的演讲声音。Adobe 表示 Sound Lift 工具仍处于开发阶段，未来上线之后，用户只需要导入音频文件，然后该工具就可以帮助你过滤掌声、笑声、警报、演讲、人群、交通、打字等诸多背景声音。Project Sound Lift 会自动检测每个声音，并吐出单独的文件，其中包含背景噪音，某人的声音或乐器的声音等。（来源：IT之家）

20、APUS与深圳大学大数据国家工程实验室达成战略合作，联合训练开源中文大模型

近日，APUS与深圳大学大数据系统计算技术国家工程实验室达成战略合作。双方集成各自优势联合开发、开源高性能中文多模态大模型Linly-Chinese-LLaMA-2-70B。据介绍，该模型将更加适配中文服务场景，计划于2024年初在APUS开源平台、GitHub及Hugging Face开源平台向公众开放。

21、微软必应现可使用人工智能为搜索结果生成标题，以提高搜索效率

微软必应搜索引擎现在可使用人工智能为部分搜索结果生成标题，该功能使用了 GPT-4 技术，可使“搜索结果更加相关和有信息量，帮助用户更快地找到他们想要的网站。”如果用户搜索某个关键词，然后点击搜索结果中的标题链接旁边的向下箭头，可以看到一些结果上标有“AI-Generated Caption（人工智能生成的标题）”。

22、韩国央行警告：AI 或抢走该国 400 万人的“饭碗”

韩国央行近日发布了一项关于人工智能（AI）对劳动力市场影响的研究报告，预测未来 20 年，AI 可能会导致该国多达 400 万个工作岗位消失，占总工作岗位的 14%。这是继高盛、麦肯锡等机构之后，又一次对 AI 威胁的警示。据韩国央行的分析师团队周四透露，由于 AI 可以更有效地完成分析和认知类的任务，因此学历和收入较高的工人将面临更大的风险。他们指出，化学家、医生、律师、会计师和资产经理人等职业最容易被 AI 取代，而餐饮、教育和音乐等领域的工作则相对安全。（来源：IT之家）

23、YouTube 推出可模仿著名歌手的 AI 工具，可用文字或哼唱创作歌曲

YouTube 正在测试新的生成式 AI 功能，让用户可以通过输入文本或哼唱一段旋律来创作音乐。其中一个功能叫做 Dream Track，已经向平台上的一些创作者提供，它可以根据著名艺人的风格自动生成 30 秒的音乐片段。该功能可以模仿九位不同的艺人，他们都是 YouTube 在开发这个功能时的合作伙伴。YouTube 还展示了一些可以通过哼唱生成音乐的新工具。（来源：IT之家）

24、谷歌将“水印”嵌入人工智能生成的音乐中，人耳无法察觉

谷歌旗下的人工智能公司 DeepMind 宣布，其开发的 AI 音频生成模型 Lyria 将使用 SynthID 技术给生成的音频添加“水印”，以便人们在事后识别出它们是由 AI 制作的。DeepMind 在一篇博客文章中表示，这种水印不会被人耳察觉，也不会影响聆听体验，并且即使音频被压缩、加快或减慢，或者添加了额外的噪音，水印仍然可以被检测出来。SynthID 等水印工具被视为防范生成型 AI 造成危害的重要保障，这是一个有前景的领域，但目前的技术还远不能成为防御伪造的万能钥匙。（来源：IT之家）

[t-success icon='']AI·发布会[/t-success]

1、微软加入自定义GPT大战！Bing Chat改名，自研芯片登场，连甩13项AI升级

今日凌晨，微软在年度IT专业人士和开发者大会Ignite上推出了一系列AI新产品，包括AI芯片、AI服务器、Copilot系列应用、Windows AI开发平台、微软Azure MaaS（模型即服务）、Fabric数据平台、MR头显助手等方面的100多项更新。八个月前，微软推出了适用于Microsoft 365的Copilot服务，据其调查，这一服务目前已获得70%用户在效率提高方面的肯定，同时68%的用户表示Copilot提高了他们的工作质量。（来源：智东西）

本次，微软进一步重新思考云基础设施，扩展微软Copilot体验，加强数据和AI的连接，并通过Azure AI为开发人员带来更多新功能，重点如下：

推出两款自研芯片：云端AI芯片微软Azure Maia 100、服务器CPU微软Azure Cobalt 100。
推出针对英伟达H100 GPU的NC H100 v5虚拟机系列预览，在Azure中加入AMD MI300X加速虚拟机。
微软Copilot支持构建个性化角色，根据用户偏好提供定制化响应。
微软Copilot数学和逻辑能力增强，支持用编程语言执行复杂数学分析，与Excel结合实现智能制表等。
Copilot全面接入Microsoft 365，会议平台Teams、电子邮箱Outlook、文档工具Word、PPT工具PowerPoint等同步升级。
推出微软Loop生成式AI协同创作工具，结合组织既有知识进行任务执行。
推出低代码开发工具微软Copilot Studio，支持用户在微软365自定义Copilot和构建私有化Copilot。
免提Copilot将上线MR头显产品HoloLens 2，助用户使用自然语言和人类手势实现交互。
推出面向Azure云的Copilot，提供IT管理的AI伴侣。
简化用户体验，Bing Chat和Bing Chat Enterprise现在统归Copilot，Copilot成其AI聊天机器人主要品牌。
微软Fabric大规模数据产品全面上线，推出Copilot in Fabric的公开预览版。
推出MaaS功能，将集成GPT-4 Turbo、Llama 2等多样化模型，支持企业在微软云上开发定制大模型。
推出Windows AI Studio开发平台，助企业和开发人员在Windows上快速启动本地AI开发和部署。