专栏 RSS订阅(公众号)
温馨提示:订阅专栏后它将会自动更新,无人订阅的专栏有可能不会更新。
专栏 二维码
TodayRss-海外RSS稳定源
他们也喜欢这个专栏
 • 
RSS订阅
今天看啥  ›  专栏  ›  NeuralTalk
关注深度学习框架开发、模型压缩、低比特量化、移动端推理加速性能优化、工程化部署
免责声明:本专栏仅为信息导航参考,不代表原文立场或观点。 原专栏内容版权归原作者所有,如您为原作者并希望删除该专栏,请通过 【版权申诉通道】联系我们处理。
开通 RSS极速订阅 可分钟级获得文章
硬件视角下 LLM 推理加速综述(第三篇):各硬件平台加速方法之算子优化、异构协作、同构协作
NeuralTalk  ·  公众号  ·  ·  11 月前  · 
硬件视角下 LLM 推理加速综述(第一篇):LLM 分类、规模演进与趋势、与硬件能力的关联、高效生成...
NeuralTalk  ·  公众号  ·  ·  12 月前  · 
0.5B 推理语言模型的技术研究:挖掘小模型精度潜力,缩小与大模型的差距,以代码生成和数学推理为例!
NeuralTalk  ·  公众号  ·  ·  12 月前  · 
为 Arm、x86、RISC-V 架构进行指令级模拟下的性能自动调优!跳过真机硬件限制,用模拟器加速...
NeuralTalk  ·  公众号  ·  ·  12 月前  · 
PerfTracker:万卡 GPU 集群超大规模训练性能问题定位利器!100万GPU 定位仅 3 ...
NeuralTalk  ·  公众号  ·  ·  1 年前  · 
J3DAI:基于小型 DNN 的 3D 堆叠 CMOS 图像传感器边缘 AI 加速器
NeuralTalk  ·  公众号  ·  ·  1 年前  · 
移动端内存不够?阿里 MNN-LLM:移动端通用 LLM 推理引擎,DRAM-Flash 混合存储和...
NeuralTalk  ·  公众号  ·  ·  1 年前  · 
Grid Sample比昇腾NPU厂商库快2.4倍!微信HPC团队硬件感知优化加速多尺度Deform...
NeuralTalk  ·  公众号  ·  ·  1 年前  · 
优化首 Token 生成时间和内存消耗!无限上下文边缘设备 Transformer 解决方案 Edg...
NeuralTalk  ·  公众号  ·  ·  1 年前  · 
16KB RAM跑MobileNet?分块多阶段融合方案msf-CNN:探索 TinyML 精度与延...
NeuralTalk  ·  公众号  ·  ·  1 年前  · 
芯片软硬件全自动化设计!计算所处理器国重实验室提出 QiMeng 方案:从特定领域处理器芯片大模型,...
NeuralTalk  ·  公众号  ·  ·  1 年前  ·