专栏 RSS订阅(公众号)
温馨提示:订阅专栏后它将会自动更新,无人订阅的专栏有可能不会更新。
专栏 二维码
TodayRss-海外RSS稳定源
他们也喜欢这个专栏
 • 
RSS订阅
今天看啥  ›  专栏  ›  NeuralTalk
关注深度学习框架开发、模型压缩、低比特量化、移动端推理加速性能优化、工程化部署
免责声明:本专栏仅为信息导航参考,不代表原文立场或观点。 原专栏内容版权归原作者所有,如您为原作者并希望删除该专栏,请通过 【版权申诉通道】联系我们处理。
开通 RSS极速订阅 可分钟级获得文章
MLC.ai 开源《Modern GPU Programming For MLSys》,从 GEMM...
NeuralTalk  ·  公众号  ·  ·  昨天  · 
对标 vLLM,SGLang 吞吐!cuTile Rust 实现近零开销安全内核,GEMM 达 96...
NeuralTalk  ·  公众号  ·  ·  5 天前  · 
不止算子优化!ncnn Vulkan int8 量化推理后端:全链路架构设计与系统性优化
NeuralTalk  ·  公众号  ·  ·  6 天前  · 
端到端 FP4 训练崩溃真凶,是权重梯度!确定性哈达玛实现端到端 9%-10%提速
NeuralTalk  ·  公众号  ·  ·  1 周前  · 
Helion DSL 赋能 vLLM 实现跨硬件高效推理:Qwen3 模型 FP8 推理加速实践
NeuralTalk  ·  公众号  ·  ·  1 周前  · 
加速GR00T N1.6具身VLA模型训练!LoongForge 开源框架实现三层全链路优化,吞吐提...
NeuralTalk  ·  公众号  ·  ·  1 周前  · 
Albireo 突破阿姆达尔极限:对比 vLLM 与 SGLang,LLM 推理吞吐量最高提升 1....
NeuralTalk  ·  公众号  ·  ·  2 周前  · 
从大规模分布式机器学习系统、AI 编译器到国产算力系统!冯思远课题组长期招收 PhD 与科研实习生
NeuralTalk  ·  公众号  ·  ·  2 周前  ·