|
|
Karpathy的AutoResearch开源项目:100次实验/夜,5分钟/轮,AI 智能体自动化... NeuralTalk · 公众号 · · 2 月前 · |
|
|
RL 驱动的 KV 缓存压缩框架 KV Policy: 超越启发式策略 SOTA 性能,仅增 1% ... NeuralTalk · 公众号 · · 2 月前 · |
|
|
超越仿真,精准预测推理性能!上交与阿里提出SynPerf:一种混合分析与机器学习的 GPU 性能预测... NeuralTalk · 公众号 · · 2 月前 · |
|
|
最高 4.7 倍加速!UCSD、Meta 提出 AutoOverlap:以块级细粒度重叠融合计算与通... NeuralTalk · 公众号 · · 2 月前 · |
|
|
5.6 倍有效吞吐提升!FlowPrefill 细粒度抢占缓解队头阻塞,满足严格 3.1 倍的 SL... NeuralTalk · 公众号 · · 2 月前 · |
|
|
3.9 倍 RL rollout 吞吐提升!GT/CMU提出推理系统ThunderAgent,用“程... NeuralTalk · 公众号 · · 2 月前 · |