|
|
决战性能之巅!MLSys 2026 CUDA 内核优化大赛开启,用代码挑战 B200 GPU 极限 NeuralTalk · 公众号 · · 3 月前 · |
|
|
鹏城联合华为昇腾、中山大学提出AscendKernelGen:NPU 算子闭环生成与评估,复杂L2 ... NeuralTalk · 公众号 · · 3 月前 · |
|
|
突破性进展!Akeana 完成全球最高性能 RISC-V 服务器芯片流片 NeuralTalk · 公众号 · · 3 月前 · |
|
|
1 核抵 8 核!解耦 RISC-V GPGPU 的控制流和数据访问:Vortex GPGPU 从 ... NeuralTalk · 公众号 · · 3 月前 · |
|
|
比真 GPU 硬件快5-17 倍的时间跳跃仿真框架 REVATI!实现 vLLM/SGLang 跨框... NeuralTalk · 公众号 · · 3 月前 · |
|
|
性能超传统库达 1.79×!AMD 提出 Triton 原生多 GPU 通信库 Iris:以 til... NeuralTalk · 公众号 · · 3 月前 · |
|
|
MobileRL:面向端侧GUI智能体的自适应在线强化学习框架,AndroidWorld 成功率达 ... NeuralTalk · 公众号 · · 4 月前 · |