专栏 RSS订阅(公众号)
温馨提示:订阅专栏后它将会自动更新,无人订阅的专栏有可能不会更新。
专栏 二维码
TodayRss-海外RSS稳定源
他们也喜欢这个专栏
 • 
RSS订阅
今天看啥  ›  专栏  ›  NeuralTalk
关注深度学习框架开发、模型压缩、低比特量化、移动端推理加速性能优化、工程化部署
免责声明:本专栏仅为信息导航参考,不代表原文立场或观点。 原专栏内容版权归原作者所有,如您为原作者并希望删除该专栏,请通过 【版权申诉通道】联系我们处理。
开通 RSS极速订阅 可分钟级获得文章
字节 veRL 团队开源大规模通用 Agent 框架 Uni-Agent,用 model-tool-...
NeuralTalk  ·  公众号  ·  ·  1 月前  · 
一条命令把 Codex 桌面应用塞进浏览器,跨 Linux、Windows、Android Term...
NeuralTalk  ·  公众号  ·  ·  1 月前  · 
NVIDIA 开源 cuDNN Frontend:用图 API 把底层内核能力封装成可复用、可调优的...
NeuralTalk  ·  公众号  ·  ·  1 月前  · 
Claude 实现、Codex 审查、人类决策领航:Humanize 项目用 RLCR 编排长程闭环...
NeuralTalk  ·  公众号  ·  ·  1 月前  · 
从形式化推理到 GPU 加速!Lean4 + TileLang 张量程序超优化器,让 Attenti...
NeuralTalk  ·  公众号  ·  ·  1 月前  · 
用 Rust 在个人 PC 上构建下一代 AI 算力中枢:KeyCompute 架构浅析
NeuralTalk  ·  公众号  ·  ·  1 月前  · 
MINISA:面向下一代可重构推理加速器的最小指令集架构,把 96.9% 指令停顿打到接近零
NeuralTalk  ·  公众号  ·  ·  1 月前  · 
Fast-dVLM:面向机器人与小batch场景的块扩散并行解码 VLM,SGLang+FP8 量化...
NeuralTalk  ·  公众号  ·  ·  1 月前  · 
破除设计迷思:AccelCIM 揭示 SRAM 存算加速器大模型推理最优解
NeuralTalk  ·  公众号  ·  ·  1 月前  · 
TokenSpeed 把 LLM 推理拆成可控流水线,为智能体编码时代重写 LLM 推理引擎的控制平...
NeuralTalk  ·  公众号  ·  ·  1 月前  · 
从文本基座到原生多模态,美团 LongCat 模型基础设施演进的极致效率之路
NeuralTalk  ·  公众号  ·  ·  1 月前  · 
高通重构万亿级版图,从端侧AI解决方案到平台战略,打通汽车与机器人,决战Agentic AI时代的具...
NeuralTalk  ·  公众号  ·  ·  1 月前  · 
大模型修硬件Bug,北大提出HWE-Bench,揭示智能体芯片设计的真实能力与致命短板
NeuralTalk  ·  公众号  ·  ·  1 月前  · 
仅81个视觉Token就能推理:DeepSeek把坐标写进思考过程,弥合多模态模型的逻辑鸿沟
NeuralTalk  ·  公众号  ·  ·  1 月前  ·