DeepSeek 宣布,其全新研发的推理模型 DeepSeek-R1-Lite 预览版正式上线。这款模型采用了强化学习训练,具备强大的推理能力,能够在数学、代码以及各种复杂逻辑推理任务上取得优异表现。
主要特点
- 强化学习训练:DeepSeek R1 系列模型使用强化学习进行训练,使得模型在推理过程中能够进行大量的反思和验证。
- 长思维链:思维链长度可达数万字,模型能够处理复杂的推理任务,并展示详细的思考过程。
- 卓越的推理效果:在数学、代码和复杂逻辑推理任务上,DeepSeek R1 系列模型的表现媲美 OpenAI 的 o1-preview 模型。模型展示了完整的思考过程,这是 OpenAI 模型没有公开的部分。
- 评测表现:在美国数学竞赛(AMC)中难度等级最高的 AIME 以及全球顶级编程竞赛(Codeforces)等评测中,DeepSeek-R1-Lite 模型的表现超越了 GPT-4 等知名模型。
- 推理过程:模型的推理过程长,并包含大量的反思和验证,这使得模型在复杂任务上的表现更加出色。
当前状态
- 预览版:DeepSeek-R1-Lite 目前仍处于迭代开发阶段,仅支持网页使用,暂不支持 API 调用。
- 较小的基座模型:预览版使用的是一个较小的基座模型,因此无法完全释放长思维链的潜力。
未来发展
- 正式版:官方表示,正式版 DeepSeek-R1 模型将完全开源,并公开技术报告和部署 API 服务。
- 持续优化:DeepSeek 团队将继续优化模型,提升其推理能力和应用场景。