|
|
减少 33.4% 访存,2.56 倍加速!NPU SoC 多 DNN 执行架构与共享缓存调度的协同设... NeuralTalk · 公众号 · · 1 年前 · |
|
|
超越 Triton?任意低精度 GPGPU 计算虚拟机,加速 LLM 服务 NeuralTalk · 公众号 · · 1 年前 · |
|
|
我们是否应该用 Lite-GPU 构建 AI 集群? NeuralTalk · 公众号 · · 1 年前 · |
|
|
Prefill 1.3倍、Decode 1.7倍加速!混合 CPU-GPU 调度和 Cache 管理... NeuralTalk · 公众号 · · 1 年前 · |
|
|
稀疏 DNN 5 倍性能突破!RISC-V 扩展的软硬件协同设计在 FPGA 上加速稀疏 DNN NeuralTalk · 公众号 · · 1 年前 · |
|
|
RISC-V 极低功耗芯片的设备端联邦持续学习:纳米无人机群研究 NeuralTalk · 公众号 · · 1 年前 · |