专栏 RSS订阅(公众号)
温馨提示:订阅专栏后它将会自动更新,无人订阅的专栏有可能不会更新。
专栏 二维码
TodayRss-海外RSS稳定源
他们也喜欢这个专栏
 • 
RSS订阅
今天看啥  ›  专栏  ›  NeuralTalk
关注深度学习框架开发、模型压缩、低比特量化、移动端推理加速性能优化、工程化部署
免责声明:本专栏仅为信息导航参考,不代表原文立场或观点。 原专栏内容版权归原作者所有,如您为原作者并希望删除该专栏,请通过 【版权申诉通道】联系我们处理。
开通 RSS极速订阅 可分钟级获得文章
4.2 倍训练狂飙:Quartet II 实现 FP4 全量化,20%损失降低引爆 LLM 效率革命
NeuralTalk  ·  公众号  ·  ·  4 月前  · 
训练-推理一致的高效多模态LLM训练:双模视觉Token修剪框架实现 4 倍加速与 99%性能保留,...
NeuralTalk  ·  公众号  ·  ·  4 月前  · 
超越链式思维:分治推理强化学习训练框架DAC-RL,显著提升复杂问题解决能力,实现6.3%的推理性能...
NeuralTalk  ·  公众号  ·  ·  4 月前  · 
碾压!Axe异构布局编译器:跨设备统一编程模型,覆盖多GPU/TPU/Trainium
NeuralTalk  ·  公众号  ·  ·  4 月前  · 
GEMM/FA 平均性能超厂商库 1.03×/1.91×!面向空间数据流架构的端到端 Tile-Ba...
NeuralTalk  ·  公众号  ·  ·  4 月前  · 
节能高达 79%!看 GPU Kernel 就知功耗!面向 GPU Kernel 的 PTX 静态分...
NeuralTalk  ·  公众号  ·  ·  4 月前  · 
Meta AI 基础设施的十年演进、下一代基础设施蓝图与 AI 自研芯片之路
NeuralTalk  ·  公众号  ·  ·  4 月前  · 
Meta揭秘:保障万亿参数AI模型稳定训练的硬件可靠性之战
NeuralTalk  ·  公众号  ·  ·  4 月前  · 
编译器测试新利器 MLIR-Forge:拼图解耦 IR 测试,让随机程序生成变得简单高效!
NeuralTalk  ·  公众号  ·  ·  4 月前  · 
跨平台 Kernel 自动生成综述:基于 LLM 的监督微调+强化学习,适配 NVIDIA/AMD/...
NeuralTalk  ·  公众号  ·  ·  4 月前  · 
面向嵌入式机器学习的可预测并行架构:16核RISC-V处理器实现548M周期确定执行
NeuralTalk  ·  公众号  ·  ·  5 月前  · 
推理<2ms!Ultralytics最新YOLO26+树莓派+国产AI加速卡实现 500 FPS 端...
NeuralTalk  ·  公众号  ·  ·  5 月前  · 
TTFT p99降低10-15%,SLO违规率下降32%:MIT、UCSD等提出GPU集群中实现可预...
NeuralTalk  ·  公众号  ·  ·  5 月前  ·