AI·新世界

DeepSeek 推出全新推理模型 DeepSeek-R1-Lite 预览版

2024年11月21日

/

文章目录[隐藏]

主要特点
当前状态
未来发展

DeepSeek 宣布，其全新研发的推理模型 DeepSeek-R1-Lite 预览版正式上线。这款模型采用了强化学习训练，具备强大的推理能力，能够在数学、代码以及各种复杂逻辑推理任务上取得优异表现。

地址：https://chat.deepseek.com

主要特点

强化学习训练：DeepSeek R1 系列模型使用强化学习进行训练，使得模型在推理过程中能够进行大量的反思和验证。
长思维链：思维链长度可达数万字，模型能够处理复杂的推理任务，并展示详细的思考过程。
卓越的推理效果：在数学、代码和复杂逻辑推理任务上，DeepSeek R1 系列模型的表现媲美 OpenAI 的 o1-preview 模型。模型展示了完整的思考过程，这是 OpenAI 模型没有公开的部分。
评测表现：在美国数学竞赛（AMC）中难度等级最高的 AIME 以及全球顶级编程竞赛（Codeforces）等评测中，DeepSeek-R1-Lite 模型的表现超越了 GPT-4 等知名模型。
推理过程：模型的推理过程长，并包含大量的反思和验证，这使得模型在复杂任务上的表现更加出色。

当前状态

预览版：DeepSeek-R1-Lite 目前仍处于迭代开发阶段，仅支持网页使用，暂不支持 API 调用。
较小的基座模型：预览版使用的是一个较小的基座模型，因此无法完全释放长思维链的潜力。

未来发展

正式版：官方表示，正式版 DeepSeek-R1 模型将完全开源，并公开技术报告和部署 API 服务。
持续优化：DeepSeek 团队将继续优化模型，提升其推理能力和应用场景。

相关文章

我们将24小时内回复。