【2024年1月26日AI晚报】OpenAI推行新模型并大降价；通义千问视觉理解模型Qwen-VL升级

文章目录[隐藏]

[t-success icon='']AI·快讯[/t-success]

[t-success icon='']AI·快讯[/t-success]

1、OpenAI大降价！修复GPT-4 Turbo“变懒”问题

今日凌晨，OpenAI宣布推出两款全新文本嵌入模型，包括更小、更高效的text-embedding-3-small和更大、性能更强的text-embeddings-3-large。OpenAI还更新了GPT-4 Turbo预览模型，修复此前模型“变懒”情况，同时发布迄今最稳健的文本审核模型，并将于下周推出全新GPT-3.5 Turbo模型，将输入价格降低了50%，将输出价格降低25%。此外，OpenAI将推出两项平台改进，让开发人员更清楚地了解自己的使用情况，并对API密钥进行控制。（来源）

2、通义千问视觉理解模型Qwen-VL升级

阿里云公布多模态大模型研究进展，通义千问视觉理解模型Qwen-VL再次升级，继Plus版本之后推出Max版本，升级版模型拥有更强的视觉推理能力和中文理解能力，能够根据图片识人、答题、创作、写代码，并在多个权威测评中获得佳绩，比肩OpenAI的GPT-4V和谷歌的Gemini Ultra。相比Qwen-VL，Qwen-VL-Plus和Qwen-VL-Max拥有更强的视觉推理和中文理解能力，整体性能堪比GPT-4V和Gemini Ultra。在MMMU、MathVista等测评中远超业界所有开源模型，在文档分析（DocVQA）、中文图像相关（MM-Bench-CN）等任务上超越GPT-4V，达到世界最佳水平。目前Qwen-VL-Plus和Qwen-VL-Max限时免费，用户可以在通义千问官网、通义千问APP直接体验Max版本模型的能力，也可以通过阿里云灵积平台（DashScope）调用模型API。

3、谷歌云与Hugging Face建立战略合作伙伴关系

1月25日，谷歌云与Hugging Face宣布双方建立战略合作伙伴关系。双方将在开放科学、开源、云和硬件方面进行合作，以便公司能够利用Hugging Face最新开放模型和谷歌云最新的云和硬件功能构建自己的AI。

4、2023年度吴文俊AI科学技术奖拟授奖项目公示

2023年度吴文俊AI科学技术奖发布拟授奖项目信息并开启公示，公示期为1月25日至2月3日。任何单位和个人对拟授奖成果有异议者，可以书面形式实名向吴文俊科学技术奖励工作办公室提出，同时需提供准确的相关材料，对于匿名以及超出公示期后提出异议者恕不予受理。据悉，“吴文俊AI科学技术奖”由中国AI学会发起主办，是我国智能科学技术领域唯一以人民科学家、AI开拓先驱、我国智能科学研究的开拓者和领军人、首届国家最高科学技术奖获得者、中国科学院院士、中国AI学会名誉理事长吴文俊先生命名，依托社会力量设立的科学技术奖，具备提名推荐国家科学技术奖资格，旨在奖励在智能科学研究中取得重要发现，着力实现原始创新与突破，或在AI领域攻克关键核心技术。

公示名单：http://www.wuwenjunkejijiang.cn/a/2235.html

5、工信部等：建设适用于生成式AI的行业数据集

工业和信息化部等九部门发布关于印发《原材料工业数字化转型工作方案（2024—2026年）》的通知。方案提出，建设适用于生成式AI的行业数据集，基于现有通用大模型技术底座进行定制化开发训练，构建细分行业大模型，面向新材料研发、供应链优化、大宗商品价格预测等应用需求，加快大模型技术深度创新。强化AI驱动，探索建立原材料企业与AI企业之间的需求匹配和创新协同机制，加快推进AI技术赋能原材料工业。建设1个新材料大数据中心、4个重点行业数字化转型推进中心、4个重点行业制造业创新中心、5个以上工业互联网标识解析二级节点、6个以上行业级工业互联网平台。（来源）

6、上海AI实验室等推出文生3D模型3DTopia

来自南洋理工大学、上海AI实验室等机构的研究人员，共同推出了文生3D基础模型3DTopia。据演示视频显示，该模型中文名叫“书生·物华”，可5分钟快速生成多样化的高精度网格与纹理。3DTopia的推理分为两个阶段进行，第一阶段根据提示词生成点云格式的粗糙模型，第二阶段基于该团队推出的Threefiner方法进行细化，完成上色等操作。

GitHub主页：https://github.com/3DTopia/3DTopia

7、澜舟科技孟子大模型开放公众服务

澜舟科技孟子GPT大模型近日正式通过网信办生成式AI备案，正式面向公众开放服务。孟子GPT大模型是澜舟科技研发的生成式可控大语言模型，能够通过多轮对话，帮助用户在特定场景中完成各种工作任务。澜舟科技本次对外开放将上线四款大模型产品，包括：孟子大模型-轻量、孟子大模型-标准、孟子大模型-金融、孟子大模型-编程。

体验地址：https://www.langboat.com/product/mchat

8、谷歌发布生成式AI驱动的艺术自拍功能升级

谷歌旗下应用艺术与文化（Arts & Culture）宣布推出艺术自拍（Art Selfie）功能的2.0版本，利用生成式AI技术将用户的自拍无缝融入到艺术品风格中，目前支持超过25种风格。此外，谷歌宣布其艺术重绘（Art Remix）功能在更多国家/地区推出。（来源）

9、剪映小规模测试AI克隆音色功能

据科技自媒体数字生命卡兹克昨日报道，字节跳动旗下剪辑软件剪映近日开启克隆音色功能的小规模测试，大约10%的用户获得了体验资格，月底可能会全量上线。该功能只支持即时朗读随机文本录音输入，不支持上传音频用于克隆音色，大约需要5-10秒的录制即可生成。（来源）

10、夸克上线大模型新产品“AI PPT”，可一键生成提纲、创作 PPT

依托自研大模型，夸克App推出全新产品“AI PPT”。用户仅需输入PPT主题，就能在几十秒内生成一份精美专业的PPT文档。“AI PPT”可根据用户输入的主题或按照内容分类生成PPT模板，并可根据用户提供的主题生成平均页数在25页以上的智能大纲，还能够在每页中在线调整结构、文字、图片。夸克“AI PPT”依托千亿参数的自研大模型和数据精调，把制作PPT的过程进行了结构化处理，提供了更加智能的使用体验。与市场上同类产品相比，夸克文档推出的“AI PPT”具有更智能、更专业、更易操作三大特点，让用户在手机端就能完成PPT创作，并联合iSlide等行业头部平台，提供海量和专业的各类模板。（来源）

11、国内首个非Attention大模型发布

岩山科技旗下创企岩芯数智（Rock AI）推出国内首个非Attention机制的大模型Yan，也是业内少有的非Transformer架构大模型。据岩芯数智CEO刘凡平介绍，Yan是一个通用大语言模型，拥有相较于同等参数Transformer的7倍训练效率、5倍推理吞吐、3倍记忆能力，同时支持CPU无损运行、低幻觉表达、100%支持私有化应用。

12、腾讯文档智能助手开启公测

腾讯文档智能助手正式开启公测，全面应用于Word、Excel、PPT、PDF、智能文档、收集表、思维导图等文档类型。腾讯文档AI能力的升级涵盖了文本内容秒级处理、函数公式运算应用、表格数据精准呈现、PPT快速生成美化、收集结果自动分析、思维导图一键生成等多项能力，并支持跨品类文档内容畅通流转。即日起，智能助手将面向全体用户陆续开放体验。

13、OpenAI 为 ChatGPT 推出多语言功能 Alpha 版，可将界面改为简体中文

OpenAI 近日为 ChatGPT 更新了“多语言功能”Alpha 版，用户可以在 ChatGPT 主界面中点击自己的头像，进入“设置”-“通用”、“语言环境（Alpha）”，即可将界面修改为简体中文。将界面修改为简体中文后，用户在 ChatGPT 聊天处的提示句按钮也变为简体中文，但用户直接按下快捷按钮后自动输入的还是英文内容，有待 OpenAI 进行改进。

AI·新世界