|
|
· 公众号 · AI · 6 月前 · |
|
|
大模型RL的Scaling Law和最佳实践 青稞AI · 公众号 · AI · 6 月前 · |
|
|
· 公众号 · AI · 6 月前 · |
|
|
· 公众号 · AI · 6 月前 · |
|
|
详解Muon优化器谱球内的最速下降 青稞AI · 公众号 · AI · 6 月前 · |
|
|
· 公众号 · AI · 6 月前 · |
|
|
· 公众号 · AI · 6 月前 · |
|
|
· 公众号 · AI · 6 月前 · |
|
|
· 公众号 · AI · 6 月前 · |
|
|
· 公众号 · AI · 6 月前 · |
|
|
· 公众号 · AI · 6 月前 · |
|
|
从工程设计角度分析一下 veRL、OpenRLHF 青稞AI · 公众号 · AI · 6 月前 · |
|
|
最新研究!你的Agent可能在“错误进化”~ 青稞AI · 公众号 · AI · 6 月前 · |
|
|
· 公众号 · AI · 6 月前 · |
|
|
· 公众号 · AI · 7 月前 · |
|
|
· 公众号 · AI · 7 月前 · |
|
|
· 公众号 · AI · 7 月前 · |
|
|
· 公众号 · AI · 7 月前 · |
|
|
· 公众号 · AI · 7 月前 · |
|
|
· 公众号 · AI · 7 月前 · |