2025年1月,百川智能宣布了两项重要的人工智能进展:全场景深度思考模型Baichuan-M1-preview的推出,以及行业首个开源医疗增强大模型Baichuan-M1-14B的发布。
- Github:https://github.com/baichuan-inc/Baichuan-M1-14B
- Huggingface(base):https://huggingface.co/baichuan-inc/Baichuan-M1-14B-Base
- Huggingface(Instruct):https://huggingface.co/baichuan-inc/Baichuan-M1-14B-Instruct
- NPU 版本支持 BF16 推理:https://modelers.cn/models/MindIE/Baichuan-M1-14B-Base

Baichuan-M1-preview:三大核心推理能力集于一身
Baichuan-M1-preview是一款综合性的AI模型,它将语言、视觉和搜索三大领域的推理能力融为一体。这款模型在多个权威评测中展示了其卓越性能,特别是在数学、代码等领域,能够与当前顶尖模型o1-preview相媲美。特别值得一提的是,Baichuan-M1-preview解锁了“医疗循证模式”,实现了从证据检索到深度推理的完整端到端服务,旨在快速且准确地回答医疗临床及科研中的复杂问题。

Baichuan-M1-14B:开源医疗增强大模型的新里程碑
与此同时,百川智能还推出了Baichuan-M1-14B,这是Baichuan-M1-preview的一个更小巧版本,同时也是行业内首款开源的医疗增强大模型。尽管尺寸较小,Baichuan-M1-14B在医疗能力上超越了参数量更大的Qwen2.5-72B,几乎达到了与o1-mini相同的水平。此外,在语言推理方面,Baichuan-M1-14B在AIME、Math等数学基准测试以及LiveCodeBench代码任务上的表现均超过了o1-preview等模型;而在视觉推理领域,该模型在MMMU-val、MathVista等权威评测中的成绩也超越了包括GPT-4o、Claude3.5 Sonnet、QVQ-72B-Preview在内的多个竞争对手。
