|
理解DeepSeek在MoE技术的演进过程和具体实现 吃果冻不吐果冻皮 · 公众号 · · 5 月前 · |
|
第21期-大模型应用书籍赠送活动 吃果冻不吐果冻皮 · 公众号 · · 5 月前 · |
|
硬核解读 DeepSeek:大模型强化学习技术原理与大模型技术发展研判 吃果冻不吐果冻皮 · 公众号 · · 5 月前 · |
|
DeepSeek R1 671B 完整版本地部署教程来了!!! 吃果冻不吐果冻皮 · 公众号 · · 6 月前 · |
|
聊聊DeepSeek-R1的技术路径 吃果冻不吐果冻皮 · 公众号 · · 6 月前 · |
|
大模型量化技术原理:总结 吃果冻不吐果冻皮 · 公众号 · · 6 月前 · |
|
MiniMax-01 技术报告深度解读与 DeepSeek-V3 对比 吃果冻不吐果冻皮 · 公众号 · · 6 月前 · |