专栏名称: NeuralTalk
关注深度学习框架开发、模型压缩、低比特量化、移动端推理加速性能优化、工程化部署
TodayRss-海外RSS稳定源
目录
今天看啥  ›  专栏  ›  NeuralTalk

端侧 NPU 的 LLM 测试时计算扩展:硬件感知块量化与 LUT 优化实现 19.0×GEMM与 ...

NeuralTalk  · 公众号  ·  · 2025-10-12 11:32
    

原文地址:访问原文地址
总结与预览地址:访问总结与预览
文章地址: 访问文章快照
推荐文章
E旅行网  ·  免签,又下一国!
23 小时前