专栏 RSS订阅(公众号)
温馨提示:订阅专栏后它将会自动更新,无人订阅的专栏有可能不会更新。
专栏 二维码
他们也喜欢这个专栏
 • 
RSS订阅
今天看啥  ›  专栏  ›  NeuralTalk
关注深度学习框架开发、模型压缩、低比特量化、移动端推理加速性能优化、工程化部署
免责声明:本专栏仅为信息导航参考,不代表原文立场或观点。 原专栏内容版权归原作者所有,如您为原作者并希望删除该专栏,请通过 【版权申诉通道】联系我们处理。
开通 RSS极速订阅 可分钟级获得文章
节省 GPU 51% Capacity 和 26% 能耗,CMU, Meta提出LithOS:迈向高...
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
阿里提出 Cost-Efficient LLMs:从 Large 到 Super-Tiny 的端到端...
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
斯坦福、CMU 提出 VeriCoder:基于 LLM 的 RTL 代码生成,VerilogEval...
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
ChiseLLM:推理大模型加速 Chisel 特定领域架构的敏捷硬件开发
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
FlashInfer:面向 LLM 服务的可定制且高效的 GPU 注意力引擎
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
性能提高 162 倍、能耗降 74 倍:基于 VEXP 扩展 RISC-V 指令集的 Softmax...
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
嵌入式端上 AI 训练方案:开源 AI 加速器和 TVM 的通用编译方法,以迁移学习应用和 RISC...
NeuralTalk  ·  公众号  ·  ·  3 月前  · 
SGLang 新手指南:理解高效执行LLM系统的秘诀
NeuralTalk  ·  公众号  ·  ·  3 月前  ·