【2023年11月16日AI晚报】WPS AI开启公测,面向用户开放体验;OPPO推出安第斯大模型AndesGPT

文章目录[隐藏]

[t-primary icon='']AI·快讯[/t-primary]

1、谷歌天气预报模型GraphCast登刊Science

11月14日,国际顶刊《科学》(Science)刊发了谷歌DeepMind研究团队的一篇论文,该论文描述了天气预报模型GraphCast,它能在一分钟内预测全球0.25°分辨率下10天内的数百个天气变量。在1380个验证目标中,GraphCast在90%的目标上优于欧洲中期天气预报中心(ECMWF)的高分辨率预报(HRES),后者被认为是全球最准确的天气预报模型之一。研究团队还将GraphCast的性能与基于ML的顶级天气预报模型盘古大模型进行了比较,发现GraphCast在252个目标中的99.2%上都表现更佳。

论文地址:https://www.science.org/doi/10.1126/science.adi2336

2、微软等开发基于GPT-4V的Agent与手机交互

11月13日,来自加州大学圣地亚哥分校、微软等机构的研究团队发表论文,开发了一种基于GPT-4V的Agent——MM-Navigator,用于开展智能手机用户界面的导航任务。研究表明无需任何训练,GPT-4V就能直接像人类一样与智能手机进行交互,完成各种指定命令。根据测试,GPT-4V在iPhone上完成类似“在50-100美元的预算内购买一个打奶泡的工具”任务的成功率可达75%。在安卓机上的测试整体来看,MM-Navigator在执行安装、购物等任务中的总体表现最高得分为52.96%,Llama 2、PaLM 2和ChatGPT等基线模型最高39.6%。

论文地址:https://arxiv.org/abs/2311.07562

3、WPS AI开启公测,面向用户开放体验

16日,金山办公宣布旗下具备大语言模型能力的人工智能办公应用WPS AI开启公测,AI功能面向全体用户陆续开放体验。金山办公CEO章庆元表示,金山办公将WPS AI定位为大语言模型的应用方,锚定AIGC(内容创作)、Copilot(智慧助理)、Insight(知识洞察)三个战略方向发展。(来源:快科技

地址:https://ai.wps.cn

4、OPPO推出安第斯大模型AndesGPT

OPPO推出自主训练、个性专属的大模型安第斯大模型——AndesGPT。据介绍,AndesGPT拥有对话增强、个人专属和端云协同三大技术特征,及知识、记忆、工具与创作四大核心能力。据悉,全新的小布助手已经接入AndesGPT大模型,支持通话助手,智能摘要功能可以提取通话记录的重要内容,还可以搞定复杂手机操作,帮你生成定制内容、总结摘要等等。

5、微软推出首款AI自研芯片,力求避免供应链瓶颈

微软发布了首款自研人工智能芯片和云计算处理器,试图在竞争日益激烈的AI计算市场掌握更多技术并增加产品供应。该公司还发布可以让客户为自己设计AI助手的新软件。微软周三在西雅图举行的年度Ignite技术大会上发布了Maia 100芯片,这款AI芯片将为该公司Azure云客户提供一种新的方式来开发和运行生成内容的AI程序。负责Azure芯片部门的副总裁表示,微软已在用Bing和Office AI产品测试该芯片。

6、全新雅虎搜索将于 2024 年上线,未来将推更多 AI 与高级功能

在 SMX 搜索引擎营销大会上,雅虎(Yahoo!)高级副总裁兼总经理 Brian Provost 表示,新雅虎将于 2024 年的头几周推出。“我们预计雅虎搜索团队将在 2024 年的前几周(也许最快几个月后)推出更多基本功能,未来还会继续推出更多人工智能和高级功能。”

7、DeepL 在 AI 翻译领域占优

翻译是一门古老的艺术——也许和文明本身一样古老。古老的根源并没有阻碍创新,生成式 AI 的兴起引发了翻译技术的井喷式增长。数据提供商 Statista 预测,AI 翻译的全球市场将从 2023 年的约 50 亿美元增长到 2030 年的约 120 亿美元。Gartner 预测,到 2025 年人类翻译者四分之一的工作量将是审阅和编辑机器翻译文本。在这一波 AI 翻译浪潮中,德国公司 DeepL 在 Google 和 Facebook 等强大竞争对手中间脱颖而出。DeepL 自 2017 年创办以来成长迅速,可能是过去 15 年翻译领域最成功的科技公司。它支持翻译 30 种语言,有逾两万家企业客户,其中包括爱思唯尔 (Elsevier) 和富士通 (Fujitsu)等知名公司,今年 1 月它的估值达到了 10 亿美元。尽管竞争日益激烈,DeepL 仍然对未来保持乐观,相信对翻译质量的重视能带来新机遇。

8、英伟达发布基于微软 Azure 的生成式 AI Foundry 服务, SAP SE、Amdocs 和 Getty Images 率先采用

微软 Ignite 2023 大会已于今天拉开帷幕,英伟达发布了基于微软智能云 Microsoft Azure 的 AI 工坊(AI foundry )服务,旨在帮助企业和初创公司在 Azure 上开发、调优和部署其自定义生成式 AI 应用。据介绍,这项 NVIDIA AI foundry 服务整合了 NVIDIA AI Foundation Models、NVIDIA NeMo 框架和工具,以及 NVIDIA DGX 云 AI 超算服务三大要素。

英伟达表示,它可以为企业提供创建自定义生成式 AI 模型的端到端解决方案,并且支持企业使用 NVIDIA AI Enterprise 软件部署其定制模型,以支持生成式 AI 应用,包括智能搜索、摘要和内容生成。目前,SAP SE、Amdocs 和 Getty Images 三大厂商已率先使用了这项服务来构建其自定义 AI 模型。除此之外,英伟达还宣布将更新 TensorRT-LLM,添加 OpenAI 的 Chat API 支持,并增强 DirectML 功能,改善 Llama 2 和 Stable Diffusion 等 AI 模型的性能。

9、12 月上线,微软发布 Personal Voice:最短 60 秒实现用户自建 AI 音频

微软 Ignite 2023 大会已经拉开帷幕,微软 Azure AI 服务部门在本次活动中推出 Personal Voice 功能,可以使用自己的声音来创建 AI 音频。微软在博文中写道:“准备用于创建 AI 语音的训练样本可能很困难或成本高昂。不过通过 Personal Voice,最短可以在 60 秒内,让用户自建和其声音相近的 AI 声音”。此功能将率先在西欧、美国东部和东南亚地区上线,公共预览版将于 12 月 1 日上线。

10、英伟达预告新版 TensorRT-LLM:推理能力飙升 5 倍、8GB 以上显卡可本地运行,支持 OpenAI 的 Chat API

微软 Ignite 2023 大会已于今天拉开帷幕,英伟达高管出席本次大会并宣布更新 TensorRT-LLM,添加了对 OpenAI Chat API 的支持。英伟达面向数据中心和 Windows PC,推出 Tensor RT-LLM 开源库。最大的特点是,如果 Windows PC 配备英伟达 GeForce RTX GPU,TensorRT-LLM 可以让 LLM 在 Windows PC 上的运行速度提高四倍。(来源:IT之家

11、微软推出网页版 Copilot,仅限 Edge 等基于 Chromium 的浏览器访问

微软 Ignite 2023 大会于今天拉开帷幕,微软推出了专门的网页版 Copilot,以便于 Windows 和 macOS 用户,体验 Copilot 的 AI 聊天服务,此前仅限于微软的各种软件应用访问使用。值得注意的是,微软官方表示仅限于使用 Edge 或者其它基于 Chromium 的浏览器,使用 Firefox 访问会跳出不支持选项。(来源:IT之家

地址:https://copilot.microsoft.com

12、微软发布 Windows AI Studio,在 Win11 上简化开发 AI 应用体验

微软在今天开幕的 Ignite 2023 大会中,面向开发者推出了全新的 “Windows AI Studio”体验,在 Win11 系统上可以简化、加速 AI 应用的开发工作。除了简化构建 AI 体验的设置过程外,Windows AI Studio 还将突出显示专门针对 GPU 和 NPU 优化的 AI 模型,只是该功能会后续推出。(来源:IT之家

13、微软宣布 Bing Chat 及其 Enterprise 企业版更名为 Copilot

在今天的 Microsoft Ignite 2023 开发者大会上,微软宣布 Bing Chat 及其企业高级版 Bing Chat for Enterprise 正式更名为 Copilot!微软通讯总监 Caitlin Roulston 表示,“将‘Bing Chat Enterprise’更名为‘Copilot’反映了我们为消费者和商业客户打造统一的 Copilot 体验的愿景”。(来源:IT之家

14、ChatGPT 代码解释器被发现存在漏洞,黑客利用可窃取你的数据

OpenAI 近日为 ChatGPT 推出了全新的代码解释器(Code Interpreter)工具,可以帮助程序员调试、完善代码编程工作。不过根据 Johann Rehberger 网络安全专家、Tom's Hardware 等多家国外媒体报道,由于该代码解释器工具可以处理任何电子表格文件,并能以图表的形式分析和呈现数据,黑客可以欺骗 ChatGPT 聊天机器人,让其执行来自第三方 URL 的指令。(来源:IT之家

15、微软推出 Copilot Studio 工具、为 Copilot for Microsoft 365 引入新功能

微软在近日召开的 Ignite 2023 活动中,介绍展示了 Microsoft Copilot 套件的一系列增强功能。这个创新工具提供了一种低代码(low-code)方法,支持为 Microsoft 365 定制 Copilot,并创建独立的 Copilot 应用。(来源:IT之家

16、谷歌发布 Mirasol:30 亿参数,将多模态理解扩展到长视频

谷歌公司近日发布新闻稿,介绍了小型人工智能模型 Mirasol,可以回答有关视频的问题并创造新的记录。AI 模型目前很难处理不同的数据流,如果要让 AI 理解视频,需要整合视频、音频和文本等不同模态的信息,这大大增加了难度。谷歌和谷歌 Deepmind 的研究人员提出了新的方法,将多模态理解扩展到长视频领域。(来源:IT之家

17、TPC 联盟成立:目标万亿以上参数 AI 模型,推进科学发现

业内领先的科研机构、美国国家超级计算中心和诸多 AI 领域龙头公司,近日联合组建了万亿参数联盟(Trillion Parameter Consortium,简称 TPC)。TPC 联盟由来自全球实验室、科研机构、学术界和工业界的科学家组成,目标是共同推进用于科学发现的 AI 模型,特别关注一万亿或更多参数的巨型模型。TPC 联盟目前已经正在开发可扩展模型架构和训练策略,组织和整理用于模型训练的科学数据,为当前和未来的百万兆次级计算平台优化 AI 库。(来源:IT之家

18、微软公布 Text To Speech Avatar AI 工具:可制作虚拟 3D 数字人、基于 Azure 平台

微软在 Ignite 大会中,为 Azure AI Speech 推出了一项名为“Azure AI Speech text to speech (TTS) avatar”的 AI 工具,号称可以生成人类逼真虚拟化身(数字人),目前这款工具已经开放给大众预览试用。微软表示,用户使用 Azure AI Speech text to speech (TTS) avatar,可以建立基于“输入文字说出内容”的虚拟化身,并结合现实人物照片训练,建立以真实人物为基础的“互动式聊天机器人”,可用于企业的营销、业务或客户服务等场景。(来源:IT之家

19、Adobe 演示 Sound Lift 工具:可分层人声和噪音音轨

Adobe 公司近日宣布正在开发名为 Project Sound Lift 的全新音频工具,可以解构录音内容,像图片一样分解成不同的声音层。Sound Lift 工具主要采用 AI 技术,可以分开掌声等嘈杂的背景声音和某人的演讲声音。Adobe 表示 Sound Lift 工具仍处于开发阶段,未来上线之后,用户只需要导入音频文件,然后该工具就可以帮助你过滤掌声、笑声、警报、演讲、人群、交通、打字等诸多背景声音。Project Sound Lift 会自动检测每个声音,并吐出单独的文件,其中包含背景噪音,某人的声音或乐器的声音等。(来源:IT之家

20、APUS与深圳大学大数据国家工程实验室达成战略合作,联合训练开源中文大模型

近日,APUS与深圳大学大数据系统计算技术国家工程实验室达成战略合作。双方集成各自优势联合开发、开源高性能中文多模态大模型Linly-Chinese-LLaMA-2-70B。据介绍,该模型将更加适配中文服务场景,计划于2024年初在APUS开源平台、GitHub及Hugging Face开源平台向公众开放。

21、微软必应现可使用人工智能为搜索结果生成标题,以提高搜索效率

微软必应搜索引擎现在可使用人工智能为部分搜索结果生成标题,该功能使用了 GPT-4 技术,可使“搜索结果更加相关和有信息量,帮助用户更快地找到他们想要的网站。”如果用户搜索某个关键词,然后点击搜索结果中的标题链接旁边的向下箭头,可以看到一些结果上标有“AI-Generated Caption(人工智能生成的标题)”。

22、韩国央行警告:AI 或抢走该国 400 万人的“饭碗”

韩国央行近日发布了一项关于人工智能(AI)对劳动力市场影响的研究报告,预测未来 20 年,AI 可能会导致该国多达 400 万个工作岗位消失,占总工作岗位的 14%。这是继高盛、麦肯锡等机构之后,又一次对 AI 威胁的警示。据韩国央行的分析师团队周四透露,由于 AI 可以更有效地完成分析和认知类的任务,因此学历和收入较高的工人将面临更大的风险。他们指出,化学家、医生、律师、会计师和资产经理人等职业最容易被 AI 取代,而餐饮、教育和音乐等领域的工作则相对安全。(来源:IT之家

23、YouTube 推出可模仿著名歌手的 AI 工具,可用文字或哼唱创作歌曲

YouTube 正在测试新的生成式 AI 功能,让用户可以通过输入文本或哼唱一段旋律来创作音乐。其中一个功能叫做 Dream Track,已经向平台上的一些创作者提供,它可以根据著名艺人的风格自动生成 30 秒的音乐片段。该功能可以模仿九位不同的艺人,他们都是 YouTube 在开发这个功能时的合作伙伴。YouTube 还展示了一些可以通过哼唱生成音乐的新工具。(来源:IT之家

24、谷歌将“水印”嵌入人工智能生成的音乐中,人耳无法察觉

谷歌旗下的人工智能公司 DeepMind 宣布,其开发的 AI 音频生成模型 Lyria 将使用 SynthID 技术给生成的音频添加“水印”,以便人们在事后识别出它们是由 AI 制作的。DeepMind 在一篇博客文章中表示,这种水印不会被人耳察觉,也不会影响聆听体验,并且即使音频被压缩、加快或减慢,或者添加了额外的噪音,水印仍然可以被检测出来。SynthID 等水印工具被视为防范生成型 AI 造成危害的重要保障,这是一个有前景的领域,但目前的技术还远不能成为防御伪造的万能钥匙。(来源:IT之家

[t-success icon='']AI·发布会[/t-success]

1、微软加入自定义GPT大战!Bing Chat改名,自研芯片登场,连甩13项AI升级

今日凌晨,微软在年度IT专业人士和开发者大会Ignite上推出了一系列AI新产品,包括AI芯片、AI服务器、Copilot系列应用、Windows AI开发平台、微软Azure MaaS(模型即服务)、Fabric数据平台、MR头显助手等方面的100多项更新。八个月前,微软推出了适用于Microsoft 365的Copilot服务,据其调查,这一服务目前已获得70%用户在效率提高方面的肯定,同时68%的用户表示Copilot提高了他们的工作质量。(来源:智东西

本次,微软进一步重新思考云基础设施,扩展微软Copilot体验,加强数据和AI的连接,并通过Azure AI为开发人员带来更多新功能,重点如下:

  1. 推出两款自研芯片:云端AI芯片微软Azure Maia 100、服务器CPU微软Azure Cobalt 100。
  2. 推出针对英伟达H100 GPU的NC H100 v5虚拟机系列预览,在Azure中加入AMD MI300X加速虚拟机。
  3. 微软Copilot支持构建个性化角色,根据用户偏好提供定制化响应。
  4. 微软Copilot数学和逻辑能力增强,支持用编程语言执行复杂数学分析,与Excel结合实现智能制表等。
  5. Copilot全面接入Microsoft 365,会议平台Teams、电子邮箱Outlook、文档工具Word、PPT工具PowerPoint等同步升级。
  6. 推出微软Loop生成式AI协同创作工具,结合组织既有知识进行任务执行。
  7. 推出低代码开发工具微软Copilot Studio,支持用户在微软365自定义Copilot和构建私有化Copilot。
  8. 免提Copilot将上线MR头显产品HoloLens 2,助用户使用自然语言和人类手势实现交互。
  9. 推出面向Azure云的Copilot,提供IT管理的AI伴侣。
  10. 简化用户体验,Bing Chat和Bing Chat Enterprise现在统归Copilot,Copilot成其AI聊天机器人主要品牌。
  11. 微软Fabric大规模数据产品全面上线,推出Copilot in Fabric的公开预览版。
  12. 推出MaaS功能,将集成GPT-4 Turbo、Llama 2等多样化模型,支持企业在微软云上开发定制大模型。
  13. 推出Windows AI Studio开发平台,助企业和开发人员在Windows上快速启动本地AI开发和部署。
我们将24小时内回复。
取消