NeuralTalk - 公众号 - 文章列表 - 历史文章

注册登录

专栏 RSS订阅（公众号）

温馨提示：订阅专栏后它将会自动更新，无人订阅的专栏有可能不会更新。

购买VIP

购买成为VIP，可查看文章或者RSS订阅

提交新专栏

我也要提交微信公众号

专栏二维码

TodayRss-海外RSS稳定源

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

小宇宙RSS订阅方法

X平台RSS订阅方法

领英公司动态RSS订阅方法

RSS代理RSS订阅方法

Telegram频道RSS订阅方法

油管文字版RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

他们也喜欢这个专栏

•

今天看啥 › 专栏 › NeuralTalk

关注深度学习框架开发、模型压缩、低比特量化、移动端推理加速性能优化、工程化部署

免责声明：本专栏仅为信息导航参考，不代表原文立场或观点。原专栏内容版权归原作者所有，如您为原作者并希望删除该专栏，请通过【版权申诉通道】联系我们处理。

最新

开通 RSS极速订阅可分钟级获得文章

长上下文推理提速 5 倍！HiSparse：层级内存驱动的稀疏注意力 GPU 推理加速方案！

NeuralTalk · 公众号 · · 2 月前 ·

推理时进化：In-Place TTT 让大模型边看边学，重塑 LLM 长文本处理范式

NeuralTalk · 公众号 · · 2 月前 ·

约束求解赋能 GPU 模糊测试工具 GPU-Fuzz：挖掘深度学习框架 GPU 高危内存错误

NeuralTalk · 公众号 · · 2 月前 ·

Anthropic 玻璃翼计划：Mythos 碾压 Opus 4.6，国家安全已经沦为科技巨头与情报...

NeuralTalk · 公众号 · · 2 月前 ·

碾压GH200注意力实现：FlatAttention在Tile数据流加速器上，计算场景利用率达86%...

NeuralTalk · 公众号 · · 2 月前 ·

将无人类容身之地。。AI加速 AI系统的闭环时代已至：ASI-Evolve实现从模型架构、预训练数据...

NeuralTalk · 公众号 · · 2 月前 ·

ASPLOS'26 高频语义等价指令挖掘，实现2.6倍加速、93%面积节省！用E-Graph反合一为...

NeuralTalk · 公众号 · · 2 月前 ·

Meta‑Harness重新定义LLM系统调优：TerminalBench‑2登顶Haiku 4.5...

NeuralTalk · 公众号 · · 2 月前 ·

暴涨 48 个 Star！探秘 NVidia SASS 逆向反汇编器 denvdis 的实现与微架构...

NeuralTalk · 公众号 · · 2 月前 ·

FPGA上的LLM推理加速1.23倍至3.83倍：SkipOPU的token级动态分配与跨层KV复用...

NeuralTalk · 公众号 · · 2 月前 ·

暴涨 128.5K Star 背后的端侧视觉 AI 终局：全芯片适配，打通从数据标注、训练到 17 ...

NeuralTalk · 公众号 · · 2 月前 ·

首个用 LLM 指导 CPU 微架构的突破性工作，破解 CPU“内存墙”难题！硬件预取 95%准确率...

NeuralTalk · 公众号 · · 2 月前 ·

为什么 AI 的“自我蒸馏”会损害大模型的推理能力？

NeuralTalk · 公众号 · · 2 月前 ·

像写软件一样造芯片：Google XLS 让软件工程师写Verilog，用编译器思维颠覆硬件开发

NeuralTalk · 公众号 · · 2 月前 ·

0.03%开销下27%吞吐提升！NCCLbpf：当 eBPF 遇见 GPU 集群通信，原子热重载实现...

NeuralTalk · 公众号 · · 2 月前 ·

在 MLIR 之上构建 HLS 工具是个好主意吗？——基于 Dynamatic HLS 编译器开发经...

NeuralTalk · 公众号 · · 3 月前 ·

4992 TOPS/s 巅峰性能！BinaryAttention将 QK 压缩到 1 比特，精度反超...

NeuralTalk · 公众号 · · 3 月前 ·

端侧LLM设计美学，手机CPU也能起飞！Meta 提出 MobileLLM-Flash：以350M~...

NeuralTalk · 公众号 · · 3 月前 ·

“几乎不可编译”到15.9倍加速！AscendCraft：面向 NPU 的内核生成方法，DSL引导转...

NeuralTalk · 公众号 · · 3 月前 ·

算子工程师末日。。。NVIDIA提出SOL-ExeBench：对标硬件效率极限，生成真实 GPU K...

NeuralTalk · 公众号 · · 3 月前 ·

关于移动版 · TodayRss海外 · RSS之家 · 卧龙AI搜索

今天看啥 - 公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

© 2025 ~ 沪ICP备11025650号