专栏 RSS订阅(公众号)
温馨提示:订阅专栏后它将会自动更新,无人订阅的专栏有可能不会更新。
专栏 二维码
他们也喜欢这个专栏
 • 
RSS订阅
今天看啥  ›  专栏  ›  NeuralTalk
关注深度学习框架开发、模型压缩、低比特量化、移动端推理加速性能优化、工程化部署
免责声明:本专栏仅为信息导航参考,不代表原文立场或观点。 原专栏内容版权归原作者所有,如您为原作者并希望删除该专栏,请通过 【版权申诉通道】联系我们处理。
开通 RSS极速订阅 可分钟级获得文章
Grid Sample比昇腾NPU厂商库快2.4倍!微信HPC团队硬件感知优化加速多尺度Deform...
NeuralTalk  ·  公众号  ·  ·  1 月前  · 
优化首 Token 生成时间和内存消耗!无限上下文边缘设备 Transformer 解决方案 Edg...
NeuralTalk  ·  公众号  ·  ·  1 月前  · 
16KB RAM跑MobileNet?分块多阶段融合方案msf-CNN:探索 TinyML 精度与延...
NeuralTalk  ·  公众号  ·  ·  1 月前  · 
芯片软硬件全自动化设计!计算所处理器国重实验室提出 QiMeng 方案:从特定领域处理器芯片大模型,...
NeuralTalk  ·  公众号  ·  ·  1 月前  · 
GPU 性能一定好?llama.cpp 图级并行加速 iPhone 15 Pro 小语言模型 CPU...
NeuralTalk  ·  公众号  ·  ·  1 月前  · 
八款神经网络加速器 μNPU 全面评估:从 Arm 到 RISC-V 架构,从超低功耗到高性能 So...
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
设备端 GPU 性能全面吊打各硬件厂商!基于张量虚拟化下的 ML Drift 框架,极致灵活 Lay...
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
用大模型实现 VHDL 代码解释、生成与优化,加速高性能微处理器设计!
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
55% 压缩率,82% 性能提升!边缘端 Qwen2.5-0.5B 推理:通过模型压缩和硬件加速实现...
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
为什么 Autotuning 对 GPGPU 的性能可移植性来说是必须的?
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
我们是否应该用 Lite-GPU 构建 AI 集群?
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
评估 Tenstorrent RISC-V 矩阵乘法加速能力
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
2.6 倍加速,能耗降 1.4 倍!量化算法与硬件协同设计混合精度 GEMM 加速器 MixPE
NeuralTalk  ·  公众号  ·  ·  2 月前  ·