|
|
· 公众号 · AI · 5 月前 · |
|
|
最新工作总结!如何解决 LLM RL 中的训推不一致? 青稞AI · 公众号 · AI · 5 月前 · |
|
|
下周二晚8点!一起聊聊Fast-dLLM v2:高效训练推理的块扩散大语言模型框架 青稞AI · 公众号 · AI · 5 月前 · |
|
|
· 公众号 · AI · 5 月前 · |
|
|
深度解构!从 LLaVA 到 Qwen3-VL,多模态大模型主流架构的演进之路 青稞AI · 公众号 · AI · 5 月前 · |
|
|
· 公众号 · AI · 5 月前 · |
|
|
· 公众号 · AI · 5 月前 · |
|
|
· 公众号 · AI · 5 月前 · |
|
|
· 公众号 · AI · 5 月前 · |
|
|
· 公众号 · AI · 5 月前 · |
|
|
VLA+RL 算法如何设计?从零上手 OpenVLA 的强化学习微调实践 青稞AI · 公众号 · AI · 5 月前 · |
|
|
RL训练总是崩?Sea AI Lab 最新成果:只需从 BF16 切换到 FP16 就行 青稞AI · 公众号 · AI · 5 月前 · |
|
|
· 公众号 · AI · 5 月前 · |
|
|
· 公众号 · AI · 5 月前 · |
|
|
从“RL比SFT更不容易遗忘”到“反观推荐系统缺陷” 青稞AI · 公众号 · AI · 5 月前 · |
|
|
· 公众号 · AI · 5 月前 · |
|
|
· 公众号 · AI · 5 月前 · |
|
|
· 公众号 · AI · 5 月前 · |
|
|
· 公众号 · AI · 5 月前 · |
|
|
为什么需要低精度格式?详解 MXFP8、MXFP4 与 NVFP4 青稞AI · 公众号 · AI · 5 月前 · |