【2023年8月24日AI晚报】Meta 推出 AI 编程工具 Code Llama;文本转语音 AI 工具 ElevenLabs推出支持 28 种语言的新文本转语音模型“Eleven Multilingual v2”

[t-success icon='']AI·快讯[/t-success]

1、文本转语音 AI 工具 ElevenLabs 完成测试阶段,支持中文等 28 种语言

AI 文本转语音公司 ElevenLabs 近日宣布扩展其平台,推出支持 28 种语言的新的文本转语音模型“Eleven Multilingual v2”,可自动识别 28 种语言,并将文本转换为语音。此次扩展标志着该平台正式完成测试阶段,使其可以为企业和个人使用。该平台使用了自主开发的新型 AI 模型,可以自动识别包括中文在内的多种语言,并生成具有“丰富情感”的语音。用户可以利用平台的声音克隆工具,无需输入文本,就可以用近 30 种语言说话。Eleven Multilingual V2 支持包括英文、中文、日语、俄语、土耳其语在内的28种语言,可通过文本生成拥有较高逼真度的语音。此外,用户还可以利用 Eleven Multilingual V2 的声音克隆工具,自动转录口语,而无须先打字。(来源:IT之家

地址:https://elevenlabs.io

2、好未来自研千亿级数学大模型 MathGPT 上线,即日起开放公测

在好未来20周年直播活动中,CTO田密宣布好未来自研的数学领域千亿级大模型MathGPT正式上线并开启公测。MathGPT官网显示,MathGPT的数学计算能力已覆盖小学、初中、高中的数学题,题目类型涵盖计算题、应用题、代数题等多个类型,还可以针对题目进行追问,暂未开放数学之外的问答互动。

申请地址:https://www.mathgpt.com

3、AI模拟芯片能效达传统芯片14倍

《自然》23日发表的研究报道了一种能效为传统数字计算机芯片14倍的人工智能(AI)模拟芯片。这一由IBM研究实验室开发的芯片在语音识别上的效率超过了通用处理器。该技术或能突破当前AI开发中因算力性能不足和效率不高而遇到的瓶颈。研究团队总结道,该研究在小模型和大模型中同时验证了模拟AI技术的性能和效率,有望成为数字系统的商业可行的替代选择。

4、酷睿轻薄本也能运行大语言模型,英特尔推动 PC 生成式 AI 落地

2023 年 8 月 18 日上午,英特尔在大湾区举办了一场技术分享会,主题是英特尔在 AIGC(人工智能生成式计算)领域的最新进展。会上,英特尔的技术专家向与会者展示了他们在 AIGC 上的技术方向,并进行了多个应用的演示。英特尔大语言模型的 Demo 安装过程非常傻瓜,英特尔已经打包成了 EXE 文件,安装并导入.Bin 格式的大语言模型就可以运行了。打开界面我们可以看到左侧可以选择聊天内容、调整模型参数和查看运算延迟,右侧则是聊天框。(来源:IT之家

5、可优化代码、撰写邮件等,消息称三星 9 月披露自家类 ChatGPT 生成式 AI 细节

根据韩媒 Korea Daily 报道,三星计划 9 月 12 日举办 Real Summit 2023 活动,将推出自家版本的生成式 AI。三星将会在活动中,向公众、媒体和三星客户公开生成式 AI 的相关信息,具备类似于 ChatGPT 的诸多技能。三星研发的类 ChatGPT 现阶段主要服务于内部员工,提供优化编程代码、撰写电子邮件、记录文档摘要等功能,以提高员工的工作效率。(来源:IT之家

6、微软已邀请部分必应聊天用户,测试“nosearch”功能

微软广告和网络服务负责人 Mikhail Parakhin 今天在 X(推特)上发布推文,表示已经邀请部分必应聊天(Bing Chat)用户,测试“nosearch”功能。Parakhin 在推文中附上了一张图片,在输入“美国现任总统是谁?”问题,必应聊天会禁用 Bing 网络搜索,直接反馈出相关的结果。

7、阿里巴巴国际站发布全链路外贸AI产品

阿里巴巴国际站首次发布全链路外贸AI产品,拥有智能商品发布与管理、市场分析、客户接待、视频聊天实时翻译、企业管理等多项功能,覆盖外贸生意所有环节。

8、浪潮信息发布大模型智算软件栈OGAI

8月24日,浪潮信息发布大模型智算软件栈OGAI。据介绍,OGAI (Open GenAI Infra)“元脑生智”,是为大模型业务提供AI算力系统环境部署、算力调度保障及模型开发管理能力的全栈全流程的智算软件栈。OGAI由浪潮信息基于大模型自身实践与服务客户的专业经验而开发。

9、韩国互联网巨头Naver推出生成式AI工具

据路透社消息,韩国互联网巨头Naver周四推出自家生成式人工智能工具。Naver表示,其名为HyperCLOVA X的AI产品将为用户提供生成式AI驱动的搜索服务,并为企业客户提供定制服务。

10、2023 年全球 AI 芯片收入或将达 530 亿美元

据 Gartner 最新报告显示,2023 年全球用于 AI 的硬件销售收入预计将达到 534 亿美元,同比增长20.9%。Gartner在报告中表示,预计 AI 半导体将保持2位数的增长,2024年其收入将增长25.6%,达到671亿美元。到2027年,AI芯片收入预计将达到1194亿美元,比 2023 年的市场规模增长一倍以上。Gartner 估计,到 2023 年底,用于设备的 AI 启用的应用处理器的价值将达到 12 亿美元,2022年该市场为 5.58 亿美元。

11、中国知网发布 AI 智能写作平台等“大模型 + AIGC”产品

据中国知网官方消息,中国知网近日正式发布基于 “大模型+AIGC”的大数据知识管理系列产品。该系列产品包括大数据治理平台、数字标准智能应用平台、知网智能写作平台、中国经济社会大数据研究平台。该系列产品旨在在各类通用大模型基础上通过知识库增强的方式,融入中国知网高质量知识资源和机构内部数据,实现大模型及其人工智能应用在机构本地低成本、轻量化部署,更好地发挥数据要素的价值。此次发布的系列产品,以知网结构化、碎片化和知识多元化的高质量文献大数据资源为基础,集通用预训练模型、行业领域预训练模型及用户本地预训练模型为一体,具有领域属性和用户个性化特色,是构建知识管理和知识服务大模型的底座。(来源:IT之家

12、TVB 公布史上首位AI港姐司仪陈婉嫣,将主持港姐决赛

据 TVB 官方微博消息,将会在于8月27日举办的2023香港小姐决赛竞选中加入史上第一位 AI 港姐司仪陈婉嫣。据TVB 表示,陈婉嫣是通过 AI 综合了过往 50 年港姐冠军的参赛片段合成而出的数字人。其名字由 AI 根据历届冠军的中英文名资料生成。2023 香港小姐竞选将会在8月27日晚8点举行。

13、蚂蚁技术研究院突破视频处理技术瓶颈,CoDeF开源一周登上GitHub榜首

近日,蚂蚁技术研究院在GitHub(全球最大的社交编程及代码托管平台)开源最新视频处理算法技术CoDeF。这是一项真实时、强细节、高保真的视频处理技术,能够将视频处理任务简化为图像处理任务,可以不加任何训练地将图像算法变成视频算法。该项技术突破了传统视频处理技术的瓶颈,开源仅一周,star近3000,迅速攀升至GitHub流行趋势榜Python语言分类第一。

14、字节跳动联手中国科学技术大学,发布多模态大模型UniDoc

据 Arxiv 页面显示,中国科学技术大学近日联手字节跳动,推出一款通用多模态大模型UniDoc。据悉,UniDoc可以同时进行文本检测、识别、定位和理解。研究团队表示,UniDoc 是一种新型的多模态模型,配备了文本检测和识别功能,此外,UniDoc 利用任务之间的有益互动来提高每个任务的性能。为了实现 UniDoc的功能,研究团队在大型指令跟随数据集上进行统一的多模态指令调整。实验结果表示,UniDoc 在多个具有挑战性的基准测试中均取得了最先进的成绩。

15、Ideogram AI 宣布图像生成模型Ideogram 开启公开测试

据 AI 初创公司 Ideogram AI 消息,图像生成模型 Ideogram v0.1 版本现已开启公开测试。这是一款图像生成模型,可根据文本生成不同风格的图片内容。该项目团队由 Mohammad Norouzi、Jonathan Ho、William Chan 以及 Chitwan Saharia 等人工智能专家组成。Ideogram AI 此前宣布成立并已完成 1650 万美元种子轮融资,a16z 和 Index Ventures 领投,AIX Ventures、Golden Ventures、谷歌人工智能项目负责人 Jeff Dean等人参投。

16、AMD 收购 AI软件公司 Mipsology,将加强 AMD AI 软件开发能力

据 AMD 官网显示,AMD 宣布收购AI软件公司 Mipsology。AMD 表示, Mipsology 的软件团队将加入 AMD AI Group,帮助进一步加快 AMD 的客户参与度并扩展 AMD的 AI 软件开发能力。该团队将帮助开发AMD完整的人工智能软件堆栈,扩展AMD的软件工具、库和模型的开放生态系统,为在 AMD 硬件上运行的人工智能模型的简化部署铺平道路。Mipsology 成立于 2015 年,总部位于法国帕莱索。该公司主要开发针对 AMD 硬件量身定制的领先 AI 推理、优化解决方案和工具。

17、Meta 推出 AI 编程工具 Code Llama,商业领域免费可用

Meta 现推出了一个名为 Code Llama 的 AI 编码工具,号称“最先进的大型编码语言模型”。该模型基于 Llama 2 大型语言模型打造,可以理解为“Llama 2 的写代码专用版”,可用于“生成新的代码并调试人类编写的工作”,目前已上线 Github。据悉,Code Llama 将采用与 Llama 2 相同的社区许可,并对研究和商业领域免费开放。(来源:IT之家

官方介绍:https://ai.meta.com/blog/code-llama-large-language-model-coding

开源地址:https://github.com/facebookresearch/codellama

[t-success icon='']AI·新创[/t-success]

1、「Wand.app」获420万美元融资,AI驱动视觉艺术创作

Wand 成立于 2021 年,旨在使艺术家能够手动定制和可视化其想法的人工智能驱动创意工具。许多人工智能驱动的创意工具对生成的内容会产生控制,最终的结果可能与有特定意愿的艺术家想要创作的作品有较大偏差;与这些人工智能驱动的创意工具不同的是,Wand 将通过视觉工具和个性化的结合来弥合这一差距。(来源:36氪

我们将24小时内回复。
取消