【2023年8月25日AI晚报】阿里云开源通义千问多模态大模型Qwen-VL;OpenAI官宣与Scale合作,支持企业微调模型

[t-success icon='']AI·快讯[/t-success]

1、阿里云开源通义千问多模态大模型Qwen-VL

阿里云推出大规模视觉语言模型Qwen-VL,并对其直接开源。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发,支持图文输入。相较于此前的VL模型,Qwen-VL除了具备基本的图文识别、描述、问答及对话能力之外,还新增了视觉定位、图像中文字理解等能力,可用于知识问答、图像标题生成、图像问答、文档问答、细粒度视觉定位等场景。

开源地址:https://modelscope.cn/models/qwen/Qwen-VL-Chat/summary

2、OpenAI官宣与Scale合作 支持企业微调模型

OpenAI 今天宣布,将与Scale合作,帮助更多公司从模型微调中受益。OpenAI 在官方声明中表示,鉴于 Scale 在帮助企业安全、有效地利用人工智能数据方面拥有丰富的经验,OpenAI将其作为首选合作伙伴,扩大OpenAI 模型微调功能的优势。Scale 的客户现在可以像通过 OpenAI 一样对 OpenAI 模型进行微调,同时还能受益于 Scale 的企业人工智能专业知识和数据引擎。OpenAI 表示,他们最近为GPT-3.5 Turbo 推出了微调功能,今年秋天还将为 GPT-4 带来微调功能。(来源

3、百度:国内首个大模型数据标注基地落地海口

据百度官微消息,日前,位于海口市秀英区的百度智能云(海口)人工智能基础数据产业基地正式启动运营,这是百度智能云与海口市政府合作共建的国内首个大模型数据标注中心。据介绍,海口数据标注基地现拥有数百名专职大模型数据标注师,标注师的本科率达到100%。据了解,百度智能云将在9月全面升级大模型服务。(来源

4、中兴通讯:年内迭代出2.0版本基础大模型

中兴通讯近期在接受调研时表示,电信大模型,已赋能运营商网络智能运维和部分增值业务;行业大模型,初步在城市治理行业试用,预计2023年底至2024年初实现商用;基础大模型,目前公司正在使用1.0版本基础大模型,年内将迭代出2.0版本基础大模型,未来公司自用和商用领域大模型都将迁移到2.0版本基础大模型上。

5、奇安信发布Q-GPT安全机器人和大模型卫士

奇安信集团在京发布了Q-GPT(奇安信大模型)安全机器人和大模型卫士。据介绍,Q-GPT安全机器人是基于奇安信大模型的“虚拟安全专家”,可以全天候工作。大模型卫士集安全风险发现、大模型访问控制、数据泄露管控、违法违规行为溯源等功能为一体。会上,京东方集团和吉利集团等客户现场签约,成为国内首批Q-GPT安全机器人和安全大模型用户。大模型卫士也获得了国内多家客户的签约意向。

6、调查显示,三分之一美国投资者愿意相信AI给出的投资建议

美国理财规划顾问认证协会(CFP Board)日前公布的问卷调查结果显示,约三分之一的受访的美国投资人表示,愿意听从生成式AI提供的财务投资建议。这次调查在今年7月初进行,CFP Board 针对一千一百多名成年投资人进行了调查。调查结果显示,有 31% 的受访者真正接受过 AI 提供的财务规划建议,80% 的受访者对这一经历表示一定程度地满意。此前牛津大学调查结果显示,AI 可以比许多机构投资者更好地挑选出合适的私募基金。研究显示,AI 模型选择的基金最终年回报比大部分人类投资者选择的基金高出 5%。

7、中国科学技术大学联手新加坡管理大学,推出图像生成模型CgT-GAN

据 Arxiv 页面显示,中国科学技术大学近日联手新加坡管理大学发布一款图像生成模型 CgT-Gan。CgT-GAN通过将图像纳入训练过程,使模型能够“看到”真实的视觉模态。具体来说,研究团队采用对抗训练来教导CgT-GAN模型模仿外部文本语料库的短语,同时利用基于CLIP的奖励机制提供语义指导。实验结果显示,CgT-GAN在所有指标上明显优于现有的方法。

8、微软 Teams 引入 Typeface AI 工具,加强品牌营销内容

微软近日宣布,将为微软 Teams 加入 AI 工具 Typeface 。据悉, Typeface 整合了Azure 机器学习、Azure OpenAI 服务和 Typeface 品牌个性化AI 的强大能力,可以用于创建创意简报、电子邮件营销活动以及多媒体在线广告等内容。用户可以在无须切换应用程序的情况下增强品牌内容。企业可以使用 Affinity AI 模式来训练 Typeface AI 应用程序,创建自己的专属内容。据悉,Typeface 在今年2月从 Stealth 平台独立,是一款面向企业用户推出的生成式 AI工具,可以为企业创建多种营销活动的内容产品。

9、微软总裁:AI 监管框架须“客观清晰易懂”,以防止约束无用招致“科幻电影场景”出现

微软公司总裁兼副董事长 Brad Smith 今日在 2023 年印度 G20 峰会上发言时强调,业界需要“真正明确清晰易懂”的 AI 监管原则,其同时呼吁业界制定 "监管蓝图",以确保 AI 始终处于人类控制之下,以防止 AI 过度发展招致“科幻电影场景”的出现。Brad Smith 表示,人们希望得到“AI 不会失控的保证”,因为他们看过“太多科幻电影”,当下 AI 正在成为一种不可或缺的技术,需要通过各领域利益相关者制定的标准来实现透明度。(来源:IT之家

[t-success icon='']AI·新创[/t-success]

1、a16z支持的「Irreverent Labs 」获新融资,AI生成视频填补多种输入

当时,Irreverent被媒体描述为一家区块链公司,开发了一款名为MechaFightClub的机器人斗鸡游戏,用户在游戏中使用NFT。该公司现在坚持认为,这款游戏的本质是一个大型机器学习模型,就Irreverant Labs而言,它将允许用户在今年年末使用各种输入方式制作视频,包括图像、文本、音频。(来源:36氪

2、「Modular 」获1亿美元融资,简化开发 AI 系统过程

人工智能初创公司「Modular 」获新一轮1亿美元融资,由General Catalyst领投,GV(Google Ventures),SV Angel,Greylock和Factory参投。Modular 成立于 2022 年,由前谷歌员工 Lattner与Davis共同创立。Lattner和Davis都认为AI如今面临受到过于复杂和分散的技术基础设施的阻碍,所以创立Modulal,专注于消除大规模构建和维护AI系统的复杂性。(来源:36氪

3、「智子引擎」完成数千万元天使+轮融资,自研多模态大模型落地B端场景

成立于2021年,智子引擎是国内较早对多模态大模型展开研究的团队。人大高瓴人工智能学院教授卢志武担任公司的首席技术顾问,并对大模型相关研究成果进行商业转化。相较于路径探索初有成效的大语言模型,多模态大模型依然几近“无人区”。基于三年多的学术研究,智子引擎团队的多模态探索已经初有成效:2021年3月,推出多模态大模型“文澜BriVL(Bridging-Vision-and-Language)”,并已迭代至2.0版本;2023年3月8日发布150亿参数规模的多模态对话应用“元乘象 ChatImg”(早于GPT-4),后续发布的2.0版本在多模态对话数据集(LLaVa)的公开评测过程中,中英双语多模态对话能力超过了目前主流的开源模型。(来源:36氪

我们将24小时内回复。
取消