【2023年10月26日AI晚报】亚马逊推出人工智能图像生成功能；腾讯混元大模型现已支持“文生图”功能，将陆续向用户开放

文章目录[隐藏]

[t-info icon='']AI·快讯[/t-info]

[t-info icon='']AI·快讯[/t-info]

1、百川智能CEO王小川：大模型是将语言变成数学模型，掌握背后的规律

百川智能CEO王小川表示，从技术上来说，语言感知比图片视频感知更难，同时智力并不是逻辑推理，而是一种抽象和比喻的能力。他打比方称，牛顿曾用三大定律把万物之间的规律变成了数学问题，这对于人类而言是巨大的进步。今天的大模型也是将语言变成数学模型，一旦掌握了语言的规律就意味着掌握了背后的知识、思考、沟通和文化。

2、亚马逊推出人工智能图像生成功能

10月25日，亚马逊宣布推出测试版图像生成功能。亚马逊称，在亚马逊广告控制台中，广告商只需选择产品并点击“生成”，该工具就能利用人工智能生成功能，根据产品细节在几秒钟内提供一组以生活方式和品牌为主题的图片。Amazon Ads主要协助Amazon上注册的卖家、供应商、书商、出版商、程式开发者或广告代理商张贴广告，广告的曝光平台包括Amazon与其它网站，此一图像生成工具仍处测试阶段，目前仅供特定广告主试用，未来也会扩大测试范围。

3、谷歌 CEO 皮查伊：正考虑为新的 AI 产品采用订阅模式

在 2023 年第三季度财报电话会议上，谷歌及其母公司 Alphabet 首席执行官桑达尔・皮查伊（Sundar Pichai）表示，该公司可能会在某些新的人工智能（AI）产品中采用订阅模式。在此次会议上，美国投行摩根士丹利分析师布莱恩・诺瓦克（Brian Nowak）询问了谷歌在人工智能搜索领域的投资，以及华尔街应该如何看待这些投资带来的未来回报。（来源：网易科技）

4、纳德拉出席高通骁龙峰会，称 Copilot 将成为下个 Windows 开始按钮

高通在昨日开幕的骁龙峰会上，正式推出了 X Elite 处理器，并公布了 9 家首批合作伙伴。在本次活动中，微软现任首席执行官萨蒂亚・纳德拉（Satya Nadella）、Windows + Devices 部门副总裁帕万・达武鲁里（Pavan Davuluri）也出席活动，现场讨论了骁龙 X Elite 和 NPU 对未来 Windows 的影响。（来源：IT之家）

5、谷歌 Play 公布新规：AI 应用禁止生成受限内容，明年开始实施

随着人工智能（AI）功能在 App 层面开启大规模应用，谷歌 Play 应用商店也发布了新规来应对这一情况。谷歌今日宣布更新开发者政策，特别是围绕生成性人工智能的主题。该公司表示，明年初，平台将要求开发者在应用程序内提供“报告或标记攻击性人工智能生成内容”的功能。谷歌表示，它希望开发者使用这些报告来告知他们应用程序中的内容过滤和审核。此外，开发者将需要遵循谷歌的指导方针，禁止和防止生成受限内容，谷歌提供的一些例子包括任何描述虐待儿童的内容等。（来源：IT之家）

6、微软 CEO 纳德拉称 AI 诞生堪比原子能，需要展开全球治理

微软现任首席执行官萨蒂亚・纳德拉（Satya Nadella）认为，人工智能（AI）的出现不亚于原子弹，呼吁全球加强监管。纳德拉近日前往 Axel Springer 总部，领取 2023 年 Axel Springer 奖，在颁奖活动中，他接受了 Axel Springers 首席执行官 Mathias Döpfner 的采访。在采访中纳德拉表示：“我认为人工智能（AI）有必要进行一定程度的全球治理，而在治理过程中必然也会伴随着一些竞争。如果我们想要形成一个成功的人工智能监管机制，需要像国际原子能机构那样展开全球合作。”（来源：IT之家）

7、阿里国际站外贸AI生意助手上线

阿里巴巴国际站的外贸AI产品“生意助手”将于11月1日上线，向所有商家开放。内测数据显示，AI生意助手能帮外贸商家提升约19%的曝光量。

8、腾讯：已有超过180个业务接入腾讯混元大模型

10月26日，腾讯宣布，腾讯混元大模型迎来全新升级，并正式对外开放“文生图”功能。据介绍，目前已有超过180个内部业务接入腾讯混元大模型，包括腾讯会议、腾讯文档、企业微信、腾讯广告和微信搜一搜等。今年9月首批通过备案后，腾讯混元大模型也已经面向C端用户陆续开放体验。

9、快手内测“AI小快”，可借助快意大模型在评论区实现智能回复

10月26日，快手正式内测“AI小快”账号，在短视频评论区为用户提供互动问答、图片生成、攻略检索、文案修改等多种基于短视频应用场景的AIGC服务。据了解，“AI小快”采用快手从零到一独立自主研发的大规模语言模型“快意”大模型作为基座。

10、小i华藏通用大模型生态正式开启

小i机器人华藏通用大模型生态正式开启。据介绍，华藏生态以1个能力基座（华藏通用大模型）、1个产品支撑（华藏开发者平台）、3项服务保障（培育、市场和投资）为支撑，在智慧金融、智能服务、ISV、IoT等领域达成商业变现。

11、扎克伯格：明年AI将成Meta最大投资领域，人力将向AI集中

在2023财年第三季度财报电话会上，Meta CEO扎克伯格强调，相信生成式AI的相关技术将让人们使用各种应用程序的方式变得更有意义，在未来，Meta甚至有可能会利用AI来根据用户的兴趣为他们直接生成内容。对于公司的后续发展，扎克伯格表示在2024年，就工程和计算资源而言，AI将成为Meta最大的投资领域。此外，扎克伯格补充道，为了避免布置大量的新员工，公司将降低一些非AI项目的优先级，并将相关人员转向从事AI工作。（来源：澎湃）

12、英特尔拓展 AI 软件业务，帮助客户开发“自研 ChatGPT”

The Information 报道称，随着英特尔在人工智能热潮中受益，该公司正在尝试更多 AI 领域的东西，例如销售人工智能软件和服务。对于这家美国芯片制造商来说，这是一个罕见的举动，特别是因为它的软件并非捆绑硬件，这意味着其客户无论是否使用英特尔芯片都不会产生影响。（来源：IT之家）

13、腾讯混元大模型现已支持“文生图”功能，将陆续向用户开放

据“鹅厂技术派”消息，腾讯混元大模型近日迎来全新升级，并正式对外开放“文生图”功能。官方宣称，升级后的腾讯混元中文效果整体超过 GPT3.5，代码能力大幅提升 20%，达到业界领先水平。（来源：IT之家）

地址：https://hunyuan.tencent.com

据介绍，大模型文生图的难点体现在对提示词的语义理解，生成内容的合理性以及生成图片的效果，针对这三个技术难点，腾讯进行了专项的技术研究，提出了一系列原创算法：

在语义理解方面，腾讯混元采用了中英文双语细粒度的模型，模型同时建模中英文实现双语理解，而不是通过翻译，通过优化算法提升了模型对细节的感知能力与生成效果，有效避免多文化差异下的理解错误。
在内容合理性方面，AI 生成人体结构和手部经常容易变形。混元文生图通过增强算法模型的图像二维空间位置感知能力，并将人体骨架和人手结构等先验信息引入到生成过程中，让生成的图像结构更合理，减少错误率。
在画面质感方面，混元文生图基于多模型融合的方法，提升生成质感。经过模型算法的优化之后，混元文生图的人像模型，包含发丝、皱纹等细节的效果提升了 30%，场景模型，包含草木、波纹等细节的效果提升了 25%。

14、Jina AI 推出全球首个开源 8K 文本嵌入模型，号称“超越 OpenAI”

Jina AI 在其官网发布新闻稿，宣布推出 jina-embeddings-v2 模型，号称是目前是唯一支持 8K（8192 个 token）上下文长度的开源产品，在功能和性能上与 OpenAI 的 text-embedding-ada-002 类似。官方表示，jina-embeddings-v2 模型，是从头开始构建的。在过去的三个月里，Jina AI 团队进行了密集研发、数据收集和调整。（来源：IT之家）

地址：https://jina.ai/news/jina-ai-launches-worlds-first-open-source-8k-text-embedding-rivaling-openai

15、用友大易TRM.AI2.0宣布正式上线

近日，用友大易TRM.AI2.0宣布正式上线。据介绍，用友大易TRM.AI2.0依托YonGPT用友企业服务大模型，将AI技术落地于人才发现、智能面试、咨询问答等多种招聘应用场景。

16、WPS AI亮相小米14发布会，推出“一键生成PPT”“随手拍”等功能

10月26日，WPS AI在小米14系列手机新品发布会上亮相。据介绍，在此次的新品研发中，小米与WPS达成深度合作，邀请用户申请体验全新的移动智能办公。WPS AI具有“一键生成PPT”“随手拍”等功能，小米14系列手机用户可下载体验。

17、为“评估测试最有能力的 AI 模型”，微软联合 OpenAI、谷歌等公司设立 1000 万美元安全基金

据 OpenAI 官网新闻稿，目前微软联合 OpenAI、谷歌、Anthropic 公司发布联合声明，将设立 1000 万美元的 AI 安全基金，主要用于推动 AI 评估研究，帮助社会能够有效地测试和评估“最有能力的 AI 模型”。这一 AI 安全基金将支持来自世界各地附属于学术机构、研究机构和初创公司的研究人员。初始资金来自 Anthropic、谷歌、微软和 OpenAI，以及其他慈善合作伙伴。这项安全基金旨在支持外界开发新的模型评估技术， “我们相信，增加该领域的资金将有助于提高安全标准，并为行业、相关部门和民间社会应对 AI 系统带来的挑战所需的缓解和控制提供见解。 ”

18、小米澎湃 OS 将 AI 大模型植入系统，率先支持 NPU 部署

小米澎湃 OS 暨 Xiaomi 14 系列新品发布会正在进行中，IT之家为大家带来全程视频直播。在今日的发布会上，金凡带来了全新的小米澎湃 OS。据介绍，小米将 AI 大模型植入系统，还有小爱输入助手，支持 AI 创作文本，一键直达。此外，小米澎湃 OS 还支持 WPS 随手拍，可以直接用拍照的方式记录文本，小米澎湃 OS 可秒懂文意。（来源：IT之家）

19、智源悟道·天鹰Aquila2-34B开源v1.2新版本

据智源社区微信公众号发文，今日，智源悟道·天鹰Aquila2-34B、AquilaChat2-34B开源最新权重v1.2版本，相较于10月12日开源的v1.0，Base模型综合客观评测提升6.9%，Chat模型在主观评测的8个二级能力维度上，均接近或超过GPT3.5水平。

悟道·天鹰Aquila2开源仓库：https://github.com/FlagAI-Open/Aquila2

20、SuperCLUE中文大模型测评基准10月榜单发布

据CLUE中文语言理解测评基准微信公众号发文，10月25日，SuperCLUE发布中文大模型10月榜单。本次评测主要考察模型在中文能力上的表现，包括专业知识技能、语言理解与生成、AI智能体和安全四大能力维度的上百个任务，选取了目前国内外最具代表性的20个通用大语言模型。与9月相比，新增了月之暗面的Moonshot、百度的文心一言4.0、科大讯飞的星火V3.0、vivo的vivoLM和阿里云的Qwen-14B。SuperCLUE通过本次评测发现，国内第一梯队大模型格局已基本形成，头部几个中文大模型已经与GPT3.5极为接近，但与GPT4的距离依然遥远。

榜单地址：https://www.superclueai.com

官网地址：https://www.cluebenchmarks.com

21、复旦团队发布中文智慧金融系统DISC-FinLLM

据机器之心报道，10月25日，复旦大学数据智能与社会计算实验室（FudanDISC）发布金融领域大语言模型DISC-FinLLM，开源了模型参数并开放Demo试用。据悉，DISC-FinLLM是一款专为金融领域设计的领域大模型，具备处理众多金融场景的多样化需求能力，包括但不限于金融情感分析、金融关系提取、政策查询与分析、多轮对话、统计分析、金融模型、实时金融信息检索和金融计算等方面。

主页地址：https://fin.fudan-disc.com

论文地址：http://arxiv.org/abs/2310.15205

GitHub地址：https://github.com/FudanDISC/DISC-FinLLM

22、Bengio、Hinton等24位专家联名呼吁AI风险管理

当地时间10月24日，Bengio、Hinton、姚期智、张亚勤等知名AI领域专家发布了一封联名信，呼吁AI风险管理。文中提到，在AI的快速发展中，本文作者对即将到来的强大AI系统的大规模风险达成了共识。他们呼吁在开发这些系统之前，采取紧急治理措施，并在AI研发中向安全和道德实践进行重大转变。

原文地址：https://managing-ai-risks.com

23、Midjourney新网站上线测试版

当地时间10月24日，Midjourney宣布推出新网站并正在进行重大更新。新网站目前已上线测试版，官方称该网站比以前快得多，具备新的灯光模式、新灯箱、新的个人搜索等。

Midjourney新网站地址：https://beta.midjourney.com

24、上海AI实验室推出通用3D模型PonderV2

据上海AI实验室微信公众号10月24日发文，近日，上海AI实验室联合香港大学、浙江大学和中国科学技术大学共同推出PonderV2通用3D预训练方法与模型，同时开源代码。PonderV2具有深度理解和感知三维真实世界的能力，并为广泛的三维应用提供强大支持。Ponder系列在通用3D方面实现三个“首次”：首次同时支持室内外使用场景；首次同时支持点云、体素和多视角图像输入；首次在不同语义层级的下游任务上达成最佳性能。

论文地址：arxiv.org/abs/2310.08586

开源地址：github.com/OpenGVLab/PonderV2

AI·新世界