品玩1月21日讯,据深度求索 DeepSeek 官方消息,DeepSeek-R1大模型正式,并同步开源模型权重。
DeepSeek-R1 遵循 MIT License,允许用户通过蒸馏技术借助 R1 训练其他模型。该模型对用户开放思维链输出,通过设置 `model='deepseek-reasoner'` 即可调用。据悉,DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。
DeepSeek 官网与 App 即日起同步更新上线。此外,DeepSeek-R1 API 服务定价为每百万输入 tokens 1 元(缓存命中)/ 4 元(缓存未命中),每百万输出 tokens 16 元。

0 条评论
请「登录」后评论