专栏 RSS订阅(公众号)
温馨提示:订阅专栏后它将会自动更新,无人订阅的专栏有可能不会更新。
专栏 二维码
他们也喜欢这个专栏
 • 
RSS订阅
今天看啥  ›  专栏  ›  GiantPandaLLM
专注于机器学习、深度学习、计算机视觉、图像处理等多个方向技术分享。团队由一群热爱技术且热衷于分享的小伙伴组成。我们坚持原创,每天一到两篇原创技术分享。希望在传播知识、分享知识的同时能够启发你,大家一起共同进步(・ω<)☆
免责声明:本专栏仅为信息导航参考,不代表原文立场或观点。 原专栏内容版权归原作者所有,如您为原作者并希望删除该专栏,请通过 【版权申诉通道】联系我们处理。
开通 RSS极速订阅 可分钟级获得文章
分享一个DeepSeek V3和R1中 Shared Experts和普通Experts融合的一个小...
GiantPandaLLM  ·  公众号  · 3D  ·  4 月前  · 
[InternLM/VL系列]InternLM2/LM2.5/ViT/VL1.5/VL2.0笔记: ...
GiantPandaLLM  ·  公众号  · 3D  ·  4 月前  · 
[KV Cache优化]MQA/GQA/YOCO/CLA/MLKV笔记: 层内和层间KV Cache...
GiantPandaLLM  ·  公众号  · 3D  ·  4 月前  · 
[张量/序列并行]图解 DeepSpeed-Ulysses & Megatron-LM TP/SP
GiantPandaLLM  ·  公众号  · 3D  ·  4 月前  · 
SGLang 支持Flash Attention V3 Backend
GiantPandaLLM  ·  公众号  · 3D  ·  4 月前  · 
DeepSeek V3/R1 推理效率分析(3):Decode 配置泛化讨论
GiantPandaLLM  ·  公众号  · 3D  ·  4 月前  · 
从零开始设计 SGLang 的 KV Cache
GiantPandaLLM  ·  公众号  · 3D  ·  4 月前  · 
DeepSeek V3/R1 推理效率分析(1):关于DeepSeek V3/R1 Decoding...
GiantPandaLLM  ·  公众号  · 3D  ·  4 月前  · 
谈谈DeepSeek-R1满血版推理部署和优化
GiantPandaLLM  ·  公众号  · 3D  ·  4 月前  · 
详解vLLM和SGLang awq dequantize kernel的魔法
GiantPandaLLM  ·  公众号  · 3D  ·  4 月前  · 
《超大规模AI实战手册》PDF领取
GiantPandaLLM  ·  公众号  · 3D  ·  4 月前  · 
从DeepSeek MoE专家负载均衡谈起
GiantPandaLLM  ·  公众号  · 3D  ·  4 月前  · 
从DeepSeek V3开源趋势重新审视大模型Infra
GiantPandaLLM  ·  公众号  · 3D  ·  4 月前  · 
SGLang MLA 实现解析
GiantPandaLLM  ·  公众号  · 3D  ·  4 月前  · 
美团基于SGLang提供INT8无损满血版DeepSeek R1部署方案
GiantPandaLLM  ·  公众号  · 3D  ·  5 月前  · 
谈谈DeepSeek原厂推理方案
GiantPandaLLM  ·  公众号  · 3D  ·  5 月前  · 
分析一下EP并行和DeepSeek开源的DeepEP代码
GiantPandaLLM  ·  公众号  · 3D  ·  5 月前  ·