|
|
Zero-Rl复现的几个比较关键的问题 刘聪NLP · 公众号 · · 1 年前 · |
|
|
用极小模型复现R1思维链失败后的感悟 刘聪NLP · 公众号 · · 1 年前 · |
|
|
QwQ-Max-Preview下周会开源 刘聪NLP · 公众号 · · 1 年前 · |
|
|
DeepSeek开源周第六天 - DeepSeek-V3 / R1 推理系统概览 刘聪NLP · 公众号 · · 1 年前 · |
|
|
DeepSeek开源周第二天-DeepEP 刘聪NLP · 公众号 · · 1 年前 · |
|
|
来了!Kimi开源Moonlight-16B-A3B的MoE模型!! 刘聪NLP · 公众号 · · 1 年前 · |