NeuralTalk - 公众号 - 文章列表 - 历史文章

注册登录

专栏 RSS订阅（公众号）

温馨提示：订阅专栏后它将会自动更新，无人订阅的专栏有可能不会更新。

购买VIP

购买成为VIP，可查看文章或者RSS订阅

提交新专栏

我也要提交微信公众号

专栏二维码

TodayRss-海外RSS稳定源

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

小宇宙RSS订阅方法

X平台RSS订阅方法

油管文字版RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

他们也喜欢这个专栏

•

今天看啥 › 专栏 › NeuralTalk

关注深度学习框架开发、模型压缩、低比特量化、移动端推理加速性能优化、工程化部署

免责声明：本专栏仅为信息导航参考，不代表原文立场或观点。原专栏内容版权归原作者所有，如您为原作者并希望删除该专栏，请通过【版权申诉通道】联系我们处理。

最新

开通 RSS极速订阅可分钟级获得文章

Karpathy的AutoResearch开源项目：100次实验/夜，5分钟/轮，AI 智能体自动化...

NeuralTalk · 公众号 · · 1 月前 ·

2.8倍解码加速与SOTA级性能！支持张量并行的多分支低秩注意力方案MLRA：Multi-Head ...

NeuralTalk · 公众号 · · 2 月前 ·

FlashAttention-4：面向非对称硬件扩展的算法与内核流水线协同设计

NeuralTalk · 公众号 · · 2 月前 ·

Attn-QAT：首个 4-bit 注意力量化感知训练，让 FP4 注意力不再掉精度，RTX 509...

NeuralTalk · 公众号 · · 2 月前 ·

基于 FPGA 的稀疏注意力加速器 FAST-Prefill：相比 NVIDIA A5000实现 2...

NeuralTalk · 公众号 · · 2 月前 ·

刷爆 KernelBench！字节 Seed 联合清华提出 CUDA Agent：大规模智能体强化学...

NeuralTalk · 公众号 · · 2 月前 ·

RL 驱动的 KV 缓存压缩框架 KV Policy: 超越启发式策略 SOTA 性能，仅增 1% ...

NeuralTalk · 公众号 · · 2 月前 ·

筛选Agentic Skills成功率提升16.2%，Agentic Skills：超越工具使用的系...

NeuralTalk · 公众号 · · 2 月前 ·

首篇 LLM 推理失败综述：揭秘 3 大推理类型中 5 类核心失败的量化特征

NeuralTalk · 公众号 · · 2 月前 ·

突破 Agentic LLM 推理的存储 I/O 瓶颈！北大、清华联合 DeepSeek 提出 Du...

NeuralTalk · 公众号 · · 2 月前 ·

Agent Skill 框架释放小语言模型潜能，12B 模型技能选择准确率逼近 90%，算力成本降低...

NeuralTalk · 公众号 · · 2 月前 ·

超越仿真，精准预测推理性能！上交与阿里提出SynPerf：一种混合分析与机器学习的 GPU 性能预测...

NeuralTalk · 公众号 · · 2 月前 ·

hls4ml：面向 FPGA AI 部署的开源模块化编译器，实现微秒级延迟、极致资源效率，支持 Py...

NeuralTalk · 公众号 · · 2 月前 ·

最高 4.7 倍加速！UCSD、Meta 提出 AutoOverlap：以块级细粒度重叠融合计算与通...

NeuralTalk · 公众号 · · 2 月前 ·

CGO'25 杀死阶段顺序问题：基于 MLIR 的等式饱和持久化 e-graph，让等价信息贯穿编译...

NeuralTalk · 公众号 · · 2 月前 ·

5.6 倍有效吞吐提升！FlowPrefill 细粒度抢占缓解队头阻塞，满足严格 3.1 倍的 SL...

NeuralTalk · 公众号 · · 2 月前 ·

NVIDIA, UCB提出Kernel Blaster：记忆增强上下文 RL 让 CUDA 内核几何...

NeuralTalk · 公众号 · · 2 月前 ·

腾讯开源 YOLO-Master：当 YOLO 遇上混合专家（MoE），端侧 AI 实时检测的新标杆...

NeuralTalk · 公众号 · · 2 月前 ·

YOLO26：十年架构演进回顾与关键性能改进综述

NeuralTalk · 公众号 · · 2 月前 ·

3.9 倍 RL rollout 吞吐提升！GT/CMU提出推理系统ThunderAgent，用“程...

NeuralTalk · 公众号 · · 2 月前 ·

关于移动版 · TodayRss海外 · RSS之家 · 卧龙AI搜索

今天看啥 - 公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

© 2025 ~ 沪ICP备11025650号