|
LLM中On-Policy与Off-Policy的本质区别是什么? 吃果冻不吐果冻皮 · 公众号 · · 3 周前 · |
|
盘一盘,2017年Transformer之后,LLM领域的重要论文 吃果冻不吐果冻皮 · 公众号 · · 1 月前 · |
|
从端侧推理看Qwen的QK演进 吃果冻不吐果冻皮 · 公众号 · · 1 月前 · |
|
揭秘大模型评测:如何用“说明书”式方法实现业务场景下的精准评估 吃果冻不吐果冻皮 · 公众号 · · 1 月前 · |