专栏 RSS订阅(公众号)
温馨提示:订阅专栏后它将会自动更新,无人订阅的专栏有可能不会更新。
专栏 二维码
TodayRss-海外RSS稳定源
他们也喜欢这个专栏
 • 
RSS订阅
今天看啥  ›  专栏  ›  InfraTech
人工智能基础技术分享
免责声明:本专栏仅为信息导航参考,不代表原文立场或观点。 原专栏内容版权归原作者所有,如您为原作者并希望删除该专栏,请通过 【版权申诉通道】联系我们处理。
开通 RSS极速订阅 可分钟级获得文章
vime框架运行Qwen3-30B-A3B多机RL训练
InfraTech  ·  公众号  ·  ·  4 天前  · 
vime: 一个融合slime与vLLM的跨平台RL框架来了!
InfraTech  ·  公众号  ·  ·  1 周前  · 
RL共卡权重同步:vLLM与训练框架之间的IPC实践
InfraTech  ·  公众号  ·  ·  2 周前  · 
Slime适配vLLM后端的实践笔记
InfraTech  ·  公众号  ·  ·  1 月前  · 
DeepSeekV4中RoPE设计解析
InfraTech  ·  公众号  ·  ·  1 月前  · 
RL训推调度与切换(Megatron⇄SGLang)机制解析
InfraTech  ·  公众号  ·  ·  1 月前  · 
图解DeepSeek V4:详细计算流程解析
InfraTech  ·  公众号  ·  ·  1 月前  · 
PD分离+弹性伸缩/角色切换的实践笔记
InfraTech  ·  公众号  ·  ·  2 月前  · 
Qwen3 VL多模态解析
InfraTech  ·  公众号  ·  ·  2 月前  · 
彻底搞懂RoPE计算原理:从1D到3D
InfraTech  ·  公众号  ·  ·  2 月前  · 
2026大模型架构概览(三):Step 3.5 Flash & Kimi K2.5
InfraTech  ·  公众号  ·  ·  2 月前  · 
PyTorch中基于CUDA IPC的进程间Tensor共享简介
InfraTech  ·  公众号  ·  ·  2 月前  · 
VLM视觉-语言融合全流程解析|基于Kimi K2.5/VL
InfraTech  ·  公众号  ·  ·  2 月前  · 
AttnRes快速看:Kimi优化残差的新方案
InfraTech  ·  公众号  ·  ·  2 月前  · 
2026大模型架构概览(二):GLM 5 & DSV3.2
InfraTech  ·  公众号  ·  ·  3 月前  · 
2026大模型架构概览(一):Qwen3.5&MiniMax M2.5
InfraTech  ·  公众号  ·  ·  3 月前  · 
如何学习大模型推理平台技术栈?
InfraTech  ·  公众号  ·  ·  3 月前  · 
推理框架极简入门:用Nano-vLLM搭建知识体系
InfraTech  ·  公众号  ·  ·  3 月前  · 
推理框架为什么没在Prefill阶段支持CUDA Graph?
InfraTech  ·  公众号  ·  ·  3 月前  ·