【2023年9月4日AI晚报】Meta 发布122 种语言的机器阅读理解数据集Belebele；腾讯混元大模型或于 9 月初生态大会上亮相

文章目录[隐藏]

[t-success icon='']AI·快讯[/t-success]

[t-success icon='']AI·快讯[/t-success]

1、Meta发布122种语言的机器阅读理解数据集

9月2日，Meta于旗下社交媒体Threads上发布了涵盖122种语言变体的多项选择机器阅读理解（MRC）数据集Belebele。该数据集可以评估高、中、低资源语言的单语言和多语言模型。每个问题有四个多选答案，并与FLORES-200数据集中的一个短文段相连。由于该数据集是完全并行的，因此可以直接比较所有语言的模型性能。

数据集地址：https://github.com/facebookresearch/belebele

论文地址：https://arxiv.org/abs/2308.16884

2、Llama 2全流程解决方案开源训练增速195%

今日，大模型开发工具社区Colossal-AI开源发布为8至512个GPU提供的Llama 2训练、微调、推理方案，对700亿参数训练加速195%，并提供一站式云平台解决方案。

开源地址：https: //github.com/hpcaitech/ColossalAI

3、腾讯混元大模型或于9月初生态大会上亮相

据中国证券报报道，8月31日，证券报记者从腾讯方面获悉，腾讯将在9月初举行的2023年腾讯全球数字生态大会上正式发布混元大模型，但并未提及是否面向公众开放。腾讯此前表示，腾讯混元大模型已经进入公司内部应用测试阶段，腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档等多个腾讯内部业务和产品，已经接入腾讯混元大模型测试并取得初步效果。

4、作业帮发布教育领域银河大模型

据作业帮微信公众号发文，9月2日，作业帮在2023中国国际服务贸易交易会上正式发布自研银河大模型。该模型融合了作业帮多年的AI算法和教育数据积累，是一款覆盖多学科、多学段、多场景的教育大模型，具备多学科知识解答、创意写作、自主提问、陪伴式辅导等功能。在测评基准上，该模型以平均分73.7分居C-Eval榜首，同时在CMMLU榜单Five-shot和Zero-shot测评中分别以平均分74.03分及73.85分位列第一。

5、首个中英语音LLM开源李开复零一万物参与

8月30日，LinkSoul.AI、北京大学和零一万物合作发表论文，提出了一个中英双语的对话模型LLaSM，同时支持录音和文本输入，并开源可商用。论文认为，“语音聊天”才是AI与人之间更方便自然的交互方式，而不仅仅是通过文本输入。该论文的共同一作Yu Shu和Siwei Dong均来自LinkSoul.AI，此前曾经在北京智源人工智能研究院工作。LinkSoul.AI是一家AI初创公司，之前推出过首个开源Llama 2的中文语言大模型。

论文地址：https://arxiv.org/abs/2308.15930

Demo地址：https://huggingface.co/LinkSoul/LLaSM-Cllama2

6、艾伦AI研究所推出生成式AI地图工具Satlas

8月31日，艾伦人工智能研究所推出关于可再生能源项目与树木覆盖率的地图工具Satlas。该工具基于欧洲航天局Sentinel-2卫星图像，使用深度学习模型来填充建筑物的外观等细节，以生成高分辨率图像。

Satlas地址：https://satlas.allen.ai

7、Steam清退包含ChatGPT模组的游戏

9月2日，Reddit帖主Shasaur发帖称，他花了三年半的时间和积蓄开发的游戏被Steam拒绝并下架了，原因是数月前，他在游戏测试版中加入了一个可选的ChatGPT模组，让玩家可以用ChatGPT的回复来替换NPC的对话。在游戏被清退时，他收到官方的邮件，回复称“您的游戏包含人工智能”。（来源：IT之家）

8、三星电子明年将在家电引入基于 Bixby 的生成式 AI

三星电子家用电器部门副总裁 Miyoung Yu 在 IFA 2023 展会上宣布，三星电子明年将在所有家用电器中引入基于 Bixby 的生成式 AI 功能。柳副社长预计，家电将通过人工智能的扩展，实现基本性能以外的服务，如空调会自动设置用户喜欢的温度，冰箱不仅可以储存食材，还可以确定状况并提出管理建议。（来源：IT之家）

9、哈佛大学文理学院将 ChatGPT 等生成式 AI 工具引入课堂，并发布使用指南

哈佛大学旗下网站 Harvard Crimson 9 月 1 日公告，该校文理学院首次发布了教授在课程中使用 ChatGPT 等生成式 AI 的指南。该指南由哈佛大学本科教育办公室发布，提供了关于生成式 AI 的工作原理及其前在学术应用的一系列信息，其重点与先前发布的全校 AI 使用指南相比，更加侧重于保护非公开数据。此外，哈佛大学文理学院要求，教师不要将学生作业输入到 AI 系统内，以免数据被第三方收集用于 AI 训练。（来源：IT之家）

10、ChatGPT 上线 Canva 插件，可生成图片和视频内容

ChatGPT Plus 订阅服务中推出了一个独特的 Canva 插件，可以让用户快速方便地生成设计、表格、图形、图片和短视频等视觉内容。用户只需输入文字，ChatGPT 就会利用 Canva 的丰富多样的模板，将文字转换成个性化的视觉模板。IT之家注意到，这个功能不同于其他的文字转图片生成器，其并不是从零开始制作图片，而是利用 Canva 已有的模板进行定制。（来源：IT之家）

AI·新世界