【2024年1月28日AI晚报】Meta发布开源代码大模型Code Llama 70B；科大讯飞发布星火认知大模型V3.5

文章目录[隐藏]

[t-success icon='']AI·快讯[/t-success]

[t-success icon='']AI·快讯[/t-success]

1、百川智能发布超千亿参数大模型 Baichuan 3，号称中文评测超越 GPT-4

今天，百川智能正式发布超千亿参数大语言模型Baichuan 3。Baichuan 3基础能力全面提升，在多项权威评测CMMLU、GAOKAO和AGI-Eval中，Baichuan 3中文任务成绩超越GPT-4。对逻辑推理能力及专业性要求较高的MCMLE、MedExam、CMExam等权威医疗评测上，Baichuan 3中文效果同样超过GPT-4。在测试逻辑推理能力的 MCMLE、MedExam、CMExam 等医疗评测上，Baichuan 3 的中文效果同样号称超过了 GPT-4，是“中文医疗任务表现最佳的大模型”。（来源）

地址：https://www.baichuan-ai.com/chat

2、书生·浦语灵笔2.0正式开源

海AI实验室微信公众号昨天宣布推出全面升级的图文混合创作大模型书生·浦语灵笔2.0（InternLM-XComposer2），书生·浦语灵笔2.0是在书生·浦语2.0的基础上通过图文拓展训练获得的。基于InternLM2强大的语言建模能力，浦语灵笔2.0的图文理解和创作能力显著提升，可为用户提供图文创作体验，在12项图文能力评测中领先同量级开源模型。书生·浦语灵笔2.0开源了图文创作大模型（InternLM-XComposer2-7B)和它背后的图文理解与问答模型（InternLM-XComposer2-VL-7B），均提供免费商用。

GitHub地址: https://github.com/InternLM/InternLM-XComposer

技术报告：https://github.com/InternLM/InternLM-XComposer/blob/InternLM-XComposer2/InternLM-XComposer2-Report.pdf

3、苹果iOS 18将搭载生成式AI

彭博社记者马克·古尔曼1月28日报道，苹果iOS 18将采用生成式AI技术，以提升Siri和Messages应用程序在问答和自动补全句子方面的能力。（来源）

4、Arc浏览器推出了移动版Arc Search

近期引发热议的新浏览器Arc，推出了移动版Arc Search。官方认为，在移动端，浏览器的主要用途是搜索。目前已在国内App store上架，大家可以下载尝试。这款浏览器致力于提升搜索效率，内置了智能浏览功能，能自动总结前六个搜索结果，助你快速做出选择。此外，Arc还将推出一项新标签同步服务，实现Windows、iOS和Mac浏览器标签的同步，让浏览更加无缝便捷！

地址：https://apps.apple.com/cn/app/arc-search/id6472513080

5、AI 浏览器助手 Brave Leo宣布将 Mixtral 8x7B 作为默认选项

AI 浏览器助手 Brave Leo在近期更新中，宣布将Mixtral 8x7B集成为Leo中默认的大语言模型（LLM），Leo是我们最近发布的，保护隐私的AI浏览器助手。Mixtral 8x7B是由Mistral AI去年12月发布的开源LLM，并且由于其速度和性能，已经被广泛使用。此外，我们对Leo用户体验进行了一些改进，重点关注更清晰的入门引导、上下文控制、输入和响应格式化以及一般的UI优化。（来源）

6、APUS联合波形智能推出中文创作大模型

1月29日，APUS联合战略合作伙伴波形智能发布了新一代中文创作大模型，主打六大核心能力：更深更广的创作垂域、更自然真实的创作文风、更强的长文本生成能力、更快的生成速度、原生支持函数调用（function calling）、原生支持个性化知识库，据称在小说写作、营销文案写作、短视频脚本写作、论文写作等Benchmark上击败了GPT等通用大型语言模型。该模型进一步赋能APUS自身产品——萤火小说，据称显著提升内容召回的利用率达50%，并运用RAG+仿写技术让AI“越写越懂你”。

7、智源发布通用向量模型BGE-M3

智源发布了BGE家族新成员——通用语义向量模型BGE-M3，支持超过100种语言，具备领先的多语言、跨语言检索能力，支撑“句子”、“段落”、“篇章”、“文档”等不同粒度的输入文本，最大输入长度为 8192，并且一站式集成了稠密检索、稀疏检索、多向量检索三种检索功能，在多个评测基准中达到最优水平。BGE-M3是首个集多语言（Multi-Linguality）、多粒度（Multi-Granularity）、多功能（Multi-Functionality）三大技术特征于一体的语义向量模型，目前已向社区全面开源并支持免费商用许可。

GitHub地址：https://github.com/FlagOpen/FlagEmbedding

模型链接：https://huggingface.co/BAAI/bge-m3

8、科大讯飞发布星火认知大模型V3.5

今天，科大讯飞发布星火认知大模型V3.5，讯飞星火V3.5七大能力全面提升，其中语言理解、数学能力超过GPT-4 Turbo，代码能力达到GPT-4 Turbo的96%，多模态理解能力达到GPT-4V的91%。讯飞星火V3.5也是首个基于全国产算力训练的大模型。去年10月24日，讯飞首个支撑万亿参数大模型训练的国产算力平台“飞星一号”正式启用。此外，科大讯飞还发布了星火语音大模型、130亿参数规模的星火开源大模型。

9、Meta发布开源大模型Code Llama 70B

Meta今日发布了开源大模型Code Llama 70B，这是其代码生成模型的新版本。Code Llama 70B经过5000亿个代码标记和代码相关数据的训练，支持100000个Tokens的更长上下文，使其能够处理和生成更长、更复杂的代码。Code Llama 70B在HumanEval上得分为 67.8，与闭源模型GPT-4（68.2）和Gemini Pro（69.4）相当，远超此前的开源代码模型CodeGen-16B-Mono（29.3）和StarCoder（40.1）等。

GitHub地址：https://github.com/facebookresearch/llama

Hugging Face地址：https://huggingface.co/codellama

10、代码编辑器Zed宣布开源：使用 Rust 编写，号称启动速度比微软 VS Code 快 4 倍

Zed 是一款新兴的代码编辑器，主打使用 Rust 构建，日前官方在博客中宣布这款编辑器正式开源。据悉，该编辑器本体代码采用 GPL 授权形式，服务器端组件使用 AGPL 授权，GPUI 用户界面框架则以 Apache 2 授权发布。Zed 编辑器最大的优势是“高性能”，号称能够充分利用设备的 CPU、GPU 能力，让应用程序启动、文件加载、键盘响应速度“更快”，官方声称，与微软 Visual Studio Code 相比，Zed 的启动速度快了 4 倍，而 RAM 占用少了一半。

GitHub地址：https://github.com/zed-industries/zed

AI·新世界