专栏 RSS订阅(公众号)
温馨提示:订阅专栏后它将会自动更新,无人订阅的专栏有可能不会更新。
专栏 二维码
TodayRss-海外RSS稳定源
他们也喜欢这个专栏
 • 
RSS订阅
今天看啥  ›  专栏  ›  NeuralTalk
关注深度学习框架开发、模型压缩、低比特量化、移动端推理加速性能优化、工程化部署
免责声明:本专栏仅为信息导航参考,不代表原文立场或观点。 原专栏内容版权归原作者所有,如您为原作者并希望删除该专栏,请通过 【版权申诉通道】联系我们处理。
开通 RSS极速订阅 可分钟级获得文章
1.25bit登顶!腾讯开源三元量化方案Sherry:用3:4稀疏榨干硬件最后一滴血,25%位宽节省...
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
TileRT v0.1.3 重磅发布:超低延迟 LLM 推理再提速,GLM-5 支持上线,在线 De...
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
评估 YOLOv11/GEMM 等应用在 Apple Silicon M1 与 M4 Pro 神经引...
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
TTFT降3倍,GPU提速5倍!高通提出 88% KV 缩减的稀疏注意力创新方案 QuoKA:赋能 ...
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
面向 dLLM 采样的高效 NPU 设计:d-PLENA 实现 NVIDIA RTX A6000 2...
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
4.2 倍训练狂飙:Quartet II 实现 FP4 全量化,20%损失降低引爆 LLM 效率革命
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
训练-推理一致的高效多模态LLM训练:双模视觉Token修剪框架实现 4 倍加速与 99%性能保留,...
NeuralTalk  ·  公众号  ·  ·  3 月前  · 
超越链式思维:分治推理强化学习训练框架DAC-RL,显著提升复杂问题解决能力,实现6.3%的推理性能...
NeuralTalk  ·  公众号  ·  ·  3 月前  · 
碾压!Axe异构布局编译器:跨设备统一编程模型,覆盖多GPU/TPU/Trainium
NeuralTalk  ·  公众号  ·  ·  3 月前  · 
GEMM/FA 平均性能超厂商库 1.03×/1.91×!面向空间数据流架构的端到端 Tile-Ba...
NeuralTalk  ·  公众号  ·  ·  3 月前  · 
节能高达 79%!看 GPU Kernel 就知功耗!面向 GPU Kernel 的 PTX 静态分...
NeuralTalk  ·  公众号  ·  ·  3 月前  · 
Meta AI 基础设施的十年演进、下一代基础设施蓝图与 AI 自研芯片之路
NeuralTalk  ·  公众号  ·  ·  3 月前  · 
Meta揭秘:保障万亿参数AI模型稳定训练的硬件可靠性之战
NeuralTalk  ·  公众号  ·  ·  3 月前  · 
编译器测试新利器 MLIR-Forge:拼图解耦 IR 测试,让随机程序生成变得简单高效!
NeuralTalk  ·  公众号  ·  ·  3 月前  · 
跨平台 Kernel 自动生成综述:基于 LLM 的监督微调+强化学习,适配 NVIDIA/AMD/...
NeuralTalk  ·  公众号  ·  ·  3 月前  ·