|
公众号 · AI · 2 月前 · · |
|
公众号 · AI · 2 月前 · · |
|
探讨Entropy(熵)机制在RL中扮演的角色 青稞AI · 公众号 · AI · 2 月前 · |
|
红温预警!“打假”7篇近期热门RL强化学习论文 青稞AI · 公众号 · AI · 2 月前 · |
|
张祥雨访谈精华版:多模态大模型研究的挣扎史和未来 青稞AI · 公众号 · AI · 2 月前 · |
|
公众号 · AI · 2 月前 · · |
|
公众号 · AI · 2 月前 · · |
|
公众号 · AI · 2 月前 · · |
|
公众号 · AI · 2 月前 · · |
|
揭示小规模SFT在R1-Style强化学习中的关键作用 青稞AI · 公众号 · AI · 2 月前 · |
|
公众号 · AI · 2 月前 · · |
|
公众号 · AI · 2 月前 · · |
|
公众号 · AI · 2 月前 · · |
|
聊聊在大模型推理强化学习中熵机制上的探索 青稞AI · 公众号 · AI · 2 月前 · |
|
公众号 · AI · 2 月前 · · |
|
公众号 · AI · 2 月前 · · |
|
公众号 · AI · 2 月前 · · |
|
探讨大模型预训练过程中的算法基石 青稞AI · 公众号 · AI · 2 月前 · |
|
Sparse VideoGen开源:完全无损,视频生成速度加速两倍,支持Wan 2.1、Hunyua... 青稞AI · 公众号 · AI · 2 月前 · |
|
公众号 · AI · 2 月前 · · |