|
|
· 公众号 · AI · 6 月前 · |
|
|
让“思考”本身有价值!为什么模型 RL 后思维链长度持续变短? 青稞AI · 公众号 · AI · 6 月前 · |
|
|
为什么视频生成稀疏注意力做不好?中科院自动化所最新提出稀疏注意力纠偏新范式 青稞AI · 公众号 · AI · 6 月前 · |
|
|
· 公众号 · AI · 6 月前 · |
|
|
· 公众号 · AI · 6 月前 · |
|
|
· 公众号 · AI · 6 月前 · |
|
|
· 公众号 · AI · 6 月前 · |
|
|
聊聊 KV 缓存的工作原理,以及 AI Infra 与 ML Infra的区别 青稞AI · 公众号 · AI · 6 月前 · |
|
|
多模态跨学科推理深度不足?复旦联合上海AI Lab、牛津等发布多模态科学推理数据集 BMMR 青稞AI · 公众号 · AI · 6 月前 · |
|
|
· 公众号 · AI · 6 月前 · |
|
|
· 公众号 · AI · 6 月前 · |
|
|
· 公众号 · AI · 6 月前 · |
|
|
纯干货!工业场景下,LLM Agent RL的一些实践感悟 青稞AI · 公众号 · AI · 6 月前 · |
|
|
· 公众号 · AI · 6 月前 · |
|
|
· 公众号 · AI · 6 月前 · |
|
|
· 公众号 · AI · 6 月前 · |
|
|
· 公众号 · AI · 6 月前 · |
|
|
最新工作总结!如何解决 LLM RL 中的训推不一致? 青稞AI · 公众号 · AI · 7 月前 · |
|
|
下周二晚8点!一起聊聊Fast-dLLM v2:高效训练推理的块扩散大语言模型框架 青稞AI · 公众号 · AI · 7 月前 · |
|
|
· 公众号 · AI · 7 月前 · |