专栏 RSS订阅(公众号)
温馨提示:订阅专栏后它将会自动更新,无人订阅的专栏有可能不会更新。
专栏 二维码
TodayRss-海外RSS稳定源
他们也喜欢这个专栏
 • 
RSS订阅
今天看啥  ›  专栏  ›  NeuralTalk
关注深度学习框架开发、模型压缩、低比特量化、移动端推理加速性能优化、工程化部署
免责声明:本专栏仅为信息导航参考,不代表原文立场或观点。 原专栏内容版权归原作者所有,如您为原作者并希望删除该专栏,请通过 【版权申诉通道】联系我们处理。
开通 RSS极速订阅 可分钟级获得文章
长上下文推理提速 5 倍!HiSparse:层级内存驱动的稀疏注意力 GPU 推理加速方案!
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
约束求解赋能 GPU 模糊测试工具 GPU-Fuzz:挖掘深度学习框架 GPU 高危内存错误
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
Anthropic 玻璃翼计划:Mythos 碾压 Opus 4.6,国家安全已经沦为科技巨头与情报...
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
将无人类容身之地。。AI加速 AI系统的闭环时代已至:ASI-Evolve实现从模型架构、预训练数据...
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
暴涨 48 个 Star!探秘 NVidia SASS 逆向反汇编器 denvdis 的实现与微架构...
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
FPGA上的LLM推理加速1.23倍至3.83倍:SkipOPU的token级动态分配与跨层KV复用...
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
暴涨 128.5K Star 背后的端侧视觉 AI 终局:全芯片适配,打通从数据标注、训练到 17 ...
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
为什么 AI 的“自我蒸馏”会损害大模型的推理能力?
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
像写软件一样造芯片:Google XLS 让软件工程师写Verilog,用编译器思维颠覆硬件开发
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
0.03%开销下27%吞吐提升!NCCLbpf:当 eBPF 遇见 GPU 集群通信,原子热重载实现...
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
在 MLIR 之上构建 HLS 工具是个好主意吗?——基于 Dynamatic HLS 编译器开发经...
NeuralTalk  ·  公众号  ·  ·  3 月前  · 
4992 TOPS/s 巅峰性能!BinaryAttention将 QK 压缩到 1 比特,精度反超...
NeuralTalk  ·  公众号  ·  ·  3 月前  · 
端侧LLM设计美学,手机CPU也能起飞!Meta 提出 MobileLLM-Flash:以350M~...
NeuralTalk  ·  公众号  ·  ·  3 月前  · 
“几乎不可编译”到15.9倍加速!AscendCraft:面向 NPU 的内核生成方法,DSL引导转...
NeuralTalk  ·  公众号  ·  ·  3 月前  · 
算子工程师末日。。。NVIDIA提出SOL-ExeBench:对标硬件效率极限,生成真实 GPU K...
NeuralTalk  ·  公众号  ·  ·  3 月前  ·