【2024年1月26日AI晚报】OpenAI推行新模型并大降价;通义千问视觉理解模型Qwen-VL升级

[t-success icon='']AI·快讯[/t-success]

1、OpenAI大降价!修复GPT-4 Turbo“变懒”问题

今日凌晨,OpenAI宣布推出两款全新文本嵌入模型,包括更小、更高效的text-embedding-3-small和更大、性能更强的text-embeddings-3-large。OpenAI还更新了GPT-4 Turbo预览模型,修复此前模型“变懒”情况,同时发布迄今最稳健的文本审核模型,并将于下周推出全新GPT-3.5 Turbo模型,将输入价格降低了50%,将输出价格降低25%。此外,OpenAI将推出两项平台改进,让开发人员更清楚地了解自己的使用情况,并对API密钥进行控制。(来源

2、通义千问视觉理解模型Qwen-VL升级

阿里云公布多模态大模型研究进展,通义千问视觉理解模型Qwen-VL再次升级,继Plus版本之后推出Max版本,升级版模型拥有更强的视觉推理能力和中文理解能力,能够根据图片识人、答题、创作、写代码,并在多个权威测评中获得佳绩,比肩OpenAI的GPT-4V和谷歌的Gemini Ultra。相比Qwen-VL,Qwen-VL-Plus和Qwen-VL-Max拥有更强的视觉推理和中文理解能力,整体性能堪比GPT-4V和Gemini Ultra。在MMMU、MathVista等测评中远超业界所有开源模型,在文档分析(DocVQA)、中文图像相关(MM-Bench-CN)等任务上超越GPT-4V,达到世界最佳水平。目前Qwen-VL-Plus和Qwen-VL-Max限时免费,用户可以在通义千问官网、通义千问APP直接体验Max版本模型的能力,也可以通过阿里云灵积平台(DashScope)调用模型API。

3、谷歌云与Hugging Face建立战略合作伙伴关系

1月25日,谷歌云与Hugging Face宣布双方建立战略合作伙伴关系。双方将在开放科学、开源、云和硬件方面进行合作,以便公司能够利用Hugging Face最新开放模型和谷歌云最新的云和硬件功能构建自己的AI。

4、2023年度吴文俊AI科学技术奖拟授奖项目公示

2023年度吴文俊AI科学技术奖发布拟授奖项目信息并开启公示,公示期为1月25日至2月3日。任何单位和个人对拟授奖成果有异议者,可以书面形式实名向吴文俊科学技术奖励工作办公室提出,同时需提供准确的相关材料,对于匿名以及超出公示期后提出异议者恕不予受理。据悉,“吴文俊AI科学技术奖”由中国AI学会发起主办,是我国智能科学技术领域唯一以人民科学家、AI开拓先驱、我国智能科学研究的开拓者和领军人、首届国家最高科学技术奖获得者、中国科学院院士、中国AI学会名誉理事长吴文俊先生命名,依托社会力量设立的科学技术奖,具备提名推荐国家科学技术奖资格,旨在奖励在智能科学研究中取得重要发现,着力实现原始创新与突破,或在AI领域攻克关键核心技术。

公示名单:http://www.wuwenjunkejijiang.cn/a/2235.html

5、工信部等:建设适用于生成式AI的行业数据集

工业和信息化部等九部门发布关于印发《原材料工业数字化转型工作方案(2024—2026年)》的通知。方案提出,建设适用于生成式AI的行业数据集,基于现有通用大模型技术底座进行定制化开发训练,构建细分行业大模型,面向新材料研发、供应链优化、大宗商品价格预测等应用需求,加快大模型技术深度创新。强化AI驱动,探索建立原材料企业与AI企业之间的需求匹配和创新协同机制,加快推进AI技术赋能原材料工业。建设1个新材料大数据中心、4个重点行业数字化转型推进中心、4个重点行业制造业创新中心、5个以上工业互联网标识解析二级节点、6个以上行业级工业互联网平台。(来源

6、上海AI实验室等推出文生3D模型3DTopia

来自南洋理工大学、上海AI实验室等机构的研究人员,共同推出了文生3D基础模型3DTopia。据演示视频显示,该模型中文名叫“书生·物华”,可5分钟快速生成多样化的高精度网格与纹理。3DTopia的推理分为两个阶段进行,第一阶段根据提示词生成点云格式的粗糙模型,第二阶段基于该团队推出的Threefiner方法进行细化,完成上色等操作。

GitHub主页:https://github.com/3DTopia/3DTopia

7、澜舟科技孟子大模型开放公众服务

澜舟科技孟子GPT大模型近日正式通过网信办生成式AI备案,正式面向公众开放服务。孟子GPT大模型是澜舟科技研发的生成式可控大语言模型,能够通过多轮对话,帮助用户在特定场景中完成各种工作任务。澜舟科技本次对外开放将上线四款大模型产品,包括:孟子大模型-轻量、孟子大模型-标准、孟子大模型-金融、孟子大模型-编程。

体验地址:https://www.langboat.com/product/mchat

8、谷歌发布生成式AI驱动的艺术自拍功能升级

谷歌旗下应用艺术与文化(Arts & Culture)宣布推出艺术自拍(Art Selfie)功能的2.0版本,利用生成式AI技术将用户的自拍无缝融入到艺术品风格中,目前支持超过25种风格。此外,谷歌宣布其艺术重绘(Art Remix)功能在更多国家/地区推出。(来源

9、剪映小规模测试AI克隆音色功能

据科技自媒体数字生命卡兹克昨日报道,字节跳动旗下剪辑软件剪映近日开启克隆音色功能的小规模测试,大约10%的用户获得了体验资格,月底可能会全量上线。该功能只支持即时朗读随机文本录音输入,不支持上传音频用于克隆音色,大约需要5-10秒的录制即可生成。(来源

10、夸克上线大模型新产品“AI PPT”,可一键生成提纲、创作 PPT

依托自研大模型,夸克App推出全新产品“AI PPT”。用户仅需输入PPT主题,就能在几十秒内生成一份精美专业的PPT文档。“AI PPT”可根据用户输入的主题或按照内容分类生成PPT模板,并可根据用户提供的主题生成平均页数在25页以上的智能大纲,还能够在每页中在线调整结构、文字、图片。夸克“AI PPT”依托千亿参数的自研大模型和数据精调,把制作PPT的过程进行了结构化处理,提供了更加智能的使用体验。与市场上同类产品相比,夸克文档推出的“AI PPT”具有更智能、更专业、更易操作三大特点,让用户在手机端就能完成PPT创作,并联合iSlide等行业头部平台,提供海量和专业的各类模板。(来源

11、国内首个非Attention大模型发布

岩山科技旗下创企岩芯数智(Rock AI)推出国内首个非Attention机制的大模型Yan,也是业内少有的非Transformer架构大模型。据岩芯数智CEO刘凡平介绍,Yan是一个通用大语言模型,拥有相较于同等参数Transformer的7倍训练效率、5倍推理吞吐、3倍记忆能力,同时支持CPU无损运行、低幻觉表达、100%支持私有化应用。

12、腾讯文档智能助手开启公测

腾讯文档智能助手正式开启公测,全面应用于Word、Excel、PPT、PDF、智能文档、收集表、思维导图等文档类型。腾讯文档AI能力的升级涵盖了文本内容秒级处理、函数公式运算应用、表格数据精准呈现、PPT快速生成美化、收集结果自动分析、思维导图一键生成等多项能力,并支持跨品类文档内容畅通流转。即日起,智能助手将面向全体用户陆续开放体验。

13、OpenAI 为 ChatGPT 推出多语言功能 Alpha 版,可将界面改为简体中文

OpenAI 近日为 ChatGPT 更新了“多语言功能”Alpha 版,用户可以在 ChatGPT 主界面中点击自己的头像,进入“设置”-“通用”、“语言环境(Alpha)”,即可将界面修改为简体中文。将界面修改为简体中文后,用户在 ChatGPT 聊天处的提示句按钮也变为简体中文,但用户直接按下快捷按钮后自动输入的还是英文内容,有待 OpenAI 进行改进。

我们将24小时内回复。
取消