|
DeepSeek开源周第二天-DeepEP 刘聪NLP · 公众号 · · 5 月前 · |
|
来了!Kimi开源Moonlight-16B-A3B的MoE模型!! 刘聪NLP · 公众号 · · 5 月前 · |
|
Deepseek的RL算法GRPO解读 刘聪NLP · 公众号 · · 5 月前 · |
|
DeepSeek最大的贡献是什么? 刘聪NLP · 公众号 · · 5 月前 · |
|
DeepSeek R1爆火后,该如何理解 LLM 中的 RL 算法? 刘聪NLP · 公众号 · · 5 月前 · |
|
s1推理模型=数据筛选+推理预算强制,也提醒大家不要进入思维误区 刘聪NLP · 公众号 · · 5 月前 · |
|
部署满血DeepSeek R1的避坑指南-vLLM 0.7.1 刘聪NLP · 公众号 · · 5 月前 · |