NeuralTalk - 公众号 - 文章列表 - 历史文章

注册登录

专栏 RSS订阅（公众号）

温馨提示：订阅专栏后它将会自动更新，无人订阅的专栏有可能不会更新。

购买VIP

购买成为VIP，可查看文章或者RSS订阅

提交新专栏

我也要提交微信公众号

专栏二维码

TodayRss-海外RSS稳定源

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

小宇宙RSS订阅方法

X平台RSS订阅方法

领英公司动态RSS订阅方法

RSS代理RSS订阅方法

Telegram频道RSS订阅方法

油管文字版RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

他们也喜欢这个专栏

•

今天看啥 › 专栏 › NeuralTalk

关注深度学习框架开发、模型压缩、低比特量化、移动端推理加速性能优化、工程化部署

免责声明：本专栏仅为信息导航参考，不代表原文立场或观点。原专栏内容版权归原作者所有，如您为原作者并希望删除该专栏，请通过【版权申诉通道】联系我们处理。

最新

开通 RSS极速订阅可分钟级获得文章

硬件视角下 LLM 推理加速综述（第三篇）：各硬件平台加速方法之算子优化、异构协作、同构协作

NeuralTalk · 公众号 · · 11 月前 ·

硬件视角下 LLM 推理加速综述（第二篇）：各硬件平台加速方法 Sparsity、Fast Deco...

NeuralTalk · 公众号 · · 11 月前 ·

硬件视角下 LLM 推理加速综述（第一篇）：LLM 分类、规模演进与趋势、与硬件能力的关联、高效生成...

NeuralTalk · 公众号 · · 12 月前 ·

Can LLMs Understand IR in Compilers？从结构分析、语法语义、执行推...

NeuralTalk · 公众号 · · 12 月前 ·

0.5B 推理语言模型的技术研究：挖掘小模型精度潜力，缩小与大模型的差距，以代码生成和数学推理为例！

NeuralTalk · 公众号 · · 12 月前 ·

迁移 CUDA 代码到其它硬件！HPCTransCompile：用 LLM 对 CUDA 代码转义！...

NeuralTalk · 公众号 · · 12 月前 ·

为 Arm、x86、RISC-V 架构进行指令级模拟下的性能自动调优！跳过真机硬件限制，用模拟器加速...

NeuralTalk · 公众号 · · 12 月前 ·

PerfTracker：万卡 GPU 集群超大规模训练性能问题定位利器！100万GPU 定位仅 3 ...

NeuralTalk · 公众号 · · 1 年前 ·

CompilerDream：学习用于通用代码优化的编译器世界模型，超越内置编译器优化标志和最先进方法...

NeuralTalk · 公众号 · · 1 年前 ·

J3DAI：基于小型 DNN 的 3D 堆叠 CMOS 图像传感器边缘 AI 加速器

NeuralTalk · 公众号 · · 1 年前 ·

MoE 所有层融到一个分布式算子GPU Kernel！FlashDMoE：GPU内核-硬件协同解锁大...

NeuralTalk · 公众号 · · 1 年前 ·

移动端内存不够？阿里 MNN-LLM：移动端通用 LLM 推理引擎，DRAM-Flash 混合存储和...

NeuralTalk · 公众号 · · 1 年前 ·

HeteroLLM：利用移动端 SoC 实现 NPU-GPU 并行异构 LLM 推理！以高通8 G...

NeuralTalk · 公众号 · · 1 年前 ·

Grid Sample比昇腾NPU厂商库快2.4倍！微信HPC团队硬件感知优化加速多尺度Deform...

NeuralTalk · 公众号 · · 1 年前 ·

优化首 Token 生成时间和内存消耗！无限上下文边缘设备 Transformer 解决方案 Edg...

NeuralTalk · 公众号 · · 1 年前 ·

16KB RAM跑MobileNet？分块多阶段融合方案msf-CNN：探索 TinyML 精度与延...

NeuralTalk · 公众号 · · 1 年前 ·

2.1倍加速！吞吐量超同等 Qwen3 17%！华为 Pangu Light：激进剪枝下加速！昇腾 ...

NeuralTalk · 公众号 · · 1 年前 ·

芯片软硬件全自动化设计！计算所处理器国重实验室提出 QiMeng 方案：从特定领域处理器芯片大模型，...

NeuralTalk · 公众号 · · 1 年前 ·

低功耗高性能！TeLLMe：首个 FPGA 三值 LLM 加速器！三值矩阵乘法查找表和预填充注意力协...

NeuralTalk · 公众号 · · 1 年前 ·

AMD 收购 AI 推理芯片初创公司 Untether AI 的团队

NeuralTalk · 公众号 · · 1 年前 ·

关于移动版 · TodayRss海外 · RSS之家 · 卧龙AI搜索

今天看啥 - 公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

© 2025 ~ 沪ICP备11025650号