专栏 RSS订阅(公众号)
温馨提示:订阅专栏后它将会自动更新,无人订阅的专栏有可能不会更新。
专栏 二维码
TodayRss-海外RSS稳定源
他们也喜欢这个专栏
 • 
RSS订阅
今天看啥  ›  专栏  ›  NeuralTalk
关注深度学习框架开发、模型压缩、低比特量化、移动端推理加速性能优化、工程化部署
免责声明:本专栏仅为信息导航参考,不代表原文立场或观点。 原专栏内容版权归原作者所有,如您为原作者并希望删除该专栏,请通过 【版权申诉通道】联系我们处理。
开通 RSS极速订阅 可分钟级获得文章
国产 GPU 们的终局之战,现在才刚刚开始
NeuralTalk  ·  公众号  ·  ·  1 月前  · 
LLM负责思考,SLM负责记忆。LightMem小模型天团重塑 Agent 记忆,延迟仅 83 毫秒
NeuralTalk  ·  公众号  ·  ·  1 月前  · 
极端边缘场景下的科学计算:AI 专用加速器的低延迟部署设计规则与 LARE 决策框架
NeuralTalk  ·  公众号  ·  ·  1 月前  · 
DeepGEMM #304浅析:Mega MoE、FP4 Indexer 与全面架构升级
NeuralTalk  ·  公众号  ·  ·  1 月前  · 
最高砍掉90%计算成本!揭开DeepSeek-V4超长上下文的高效密码与未解难题
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
DeepSeek 开源内部训练算子库 TileKernels:MoE 路由到量化融合,全部用 Til...
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
构建面向 LLM 的下一代记忆管理系统,开源项目 Hypatia:为大模型装上“结构化外脑”
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
AMD 提出多芯粒 GPU 的 MegaKernel 方案 Fleet:通过 Chiplet 任务抽...
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
基于重叠保护域的RISC-V SoC抗SEU设计,实现容错率>99.9%,面积节省22%
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
瑞芯微的端侧AI盛宴:12.5亿存货豪赌协处理器,能否跑赢芯片迭代的折旧周期?利润暴涨74%背后的现...
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
超越 vLLM 与 SGLang!Event Tensor:以动态 MegaKernel 消除重编译...
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
开放指令集的 AI 答卷:PyTorch 登陆 RISC-V 架构的技术长征与生态破局
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
突破 NUMA 访存墙!ArcLight:面向众核 CPU 的轻量级大语言模型推理架构
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
智能体的致命随机性幻象:没有灵魂的骰子
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
用GPU原型验证,用TPU训练和推理!TorchTPU:谷歌 Meta 联手让 PyTorch 原生...
NeuralTalk  ·  公众号  ·  ·  2 月前  · 
FP4 Explore, BF16 Train:扩散强化学习的效率革命——4.64 倍加速背后的算法...
NeuralTalk  ·  公众号  ·  ·  2 月前  ·