|
马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI 人工智能与算法学习 · 公众号 · · 5 月前 · |
|
刚刚!DeepSeek团队丢出注意力新机制重磅论文 人工智能与算法学习 · 公众号 · · 5 月前 · |
|
全新超稀疏架构,推理成本比MoE直降83%! 人工智能与算法学习 · 公众号 · · 5 月前 · |
|
4500美元复刻DeepSeek神话,1.5B战胜o1-preview只用RL!训练细节全公开 人工智能与算法学习 · 公众号 · · 5 月前 · |
|
吴恩达押注Agent新成果官宣! 人工智能与算法学习 · 公众号 · · 5 月前 · |
|
DeepSeek用的GRPO占用大量内存?有人给出了些破解方法 人工智能与算法学习 · 公众号 · · 5 月前 · |
|
DeepSeek背后的数学:深入解析GRPO 人工智能与算法学习 · 公众号 · · 5 月前 · |