DeepSeek 发布DeepSeek R1-0528
安爸
发布于
DeepSeek 发布DeepSeek R1-0528:
- 代码能力能力显著提,可快速生成高质量代码
- 现在能够像 Google 模型一样进行深入推理
- 改进写作任务 – 更自然、格式更好
- 独特的推理风格——不仅快速,而且深思熟虑
- 长时间思考——每个任务最多 30-60 分钟
- 问题修复:改进了早期 R1 模型的重复、格式混乱和语言混合问题
Benchmark 评测:在由 UC Berkeley、MIT 和 Cornell 开发的 LiveCodeBench 代码生成评测中:
- R1-0528 的推理能力与 OpenAI 的 o3等前沿模型性能相当,略低于o4 mini,尤其在数学、编程和复杂推理任务上表现出色
- 优于 xAI 的 Grok 3 mini 和阿里巴巴的 Qwen 3

最新调用Deepseek-R1-0528 API 的网站:
- Openrouter 地址:https://openrouter.ai
- GMI tutt: https://inference-engine.gmicloud.ai
- Novita tutt: https://novita.ai
- Nebius tbtit: https://studio.nebius.com
- Inference toti: https://inference.net
参考文献:
[1] 详细介绍:https://huggingface.co/deepseek-ai/DeepSeek-R1-0528/tree/main
[2] 模型地址:https://www.xiaohu.ai/c/xiaohu-ai/deepseek-deepseek-r1-0528
知识星球服务内容:Dify源码剖析及答疑,Dify对话系统源码,NLP电子书籍报告下载,公众号所有付费资料。加微信buxingtianxia21进NLP工程化资料群。
(文:NLP工程化)
扫描二维码,在手机上阅读