|
大模型架构历史演进 - The Big LLM Architecture Comparison oldpan博客 · 公众号 · · 5 天前 · |
|
显卡基础知识|英伟达算力开挂的GPU! oldpan博客 · 公众号 · · 2 月前 · |
|
vLLM V1 Scheduler的调度逻辑&优先级分析 oldpan博客 · 公众号 · · 2 月前 · |
|
免费 | 中国人民大学公开7.5小时大模型导论视频课程(含10次直播答疑) oldpan博客 · 公众号 · · 4 月前 · |
|
和满血R1性能一样的推理QWQ-32B开源,部署成本拉低一大截 oldpan博客 · 公众号 · · 4 月前 · |
|
[vLLM vs TensorRT-LLM] #6. Weight-Only Quantizatio... oldpan博客 · 公众号 · · 5 月前 · |
|
完整的671B MoE DeepSeek R1如何本地化部署? oldpan博客 · 公众号 · · 6 月前 · |
|
书生·浦语大模型升级,突破思维密度,4T数据训出高性能模型 oldpan博客 · 公众号 · · 6 月前 · |
|
从算法转到模型推理的应届生拿到6个offer:思考与经验 oldpan博客 · 公众号 · · 6 月前 · |