|
|
GLM大模型的机器翻译能力测试 GiantPandaLLM · 公众号 · 3D · 1 年前 · |
|
|
LLM101n 硬核代码解读:Micrograd,一个轻量级的自动微分引擎 GiantPandaLLM · 公众号 · 3D · 1 年前 · |
|
|
CUDA-MODE课程笔记 第8课: CUDA性能检查清单 GiantPandaLLM · 公众号 · 3D · 1 年前 · |
|
|
LLM 20,000 QPS背后的力量:揭秘Character AI的高效推理技术 GiantPandaLLM · 公众号 · 3D · 1 年前 · |
|
|
Diffusion反馈强势助力CLIP秒变火眼金睛:北京智源研究院、中科院自动化所联合推出DIVA GiantPandaLLM · 公众号 · 3D · 1 年前 · |
|
|
TRT-LLM中的Quantization GEMM(Ampere Mixed GEMM)CUTLA... GiantPandaLLM · 公众号 · 3D · 1 年前 · |
|
|
图解大模型计算加速系列:分离式推理架构2,模糊分离与合并边界的chunked-prefills GiantPandaLLM · 公众号 · 3D · 1 年前 · |
|
|
SGLang:LLM推理引擎发展新方向 GiantPandaLLM · 公众号 · 3D · 1 年前 · |
|
|
CUDA-MODE课程笔记 第7课: Quantization Cuda vs Triton GiantPandaLLM · 公众号 · 3D · 1 年前 · |
|
|
LLM101n 硬核代码解读:手把手教你用PyTorch实现多层感知机MLP GiantPandaLLM · 公众号 · 3D · 1 年前 · |
|
|
A100算力加持!书生大模型实战营全面升级,趣味闯关等你来 GiantPandaLLM · 公众号 · 3D · 1 年前 · |
|
|
一文弄懂 LLM 结构化数据生成原理 GiantPandaLLM · 公众号 · 3D · 1 年前 · |
|
|
· 公众号 · 3D · 1 年前 · |
|
|
CUTLASS 2.x & CUTLASS 3.x Intro 学习笔记 GiantPandaLLM · 公众号 · 3D · 1 年前 · |
|
|
FP8 低精度训练:Transformer Engine 简析 GiantPandaLLM · 公众号 · 3D · 1 年前 · |
|
|
图解大模型计算加速系列:vLLM源码解析3,Prefix Caching GiantPandaLLM · 公众号 · 3D · 1 年前 · |
|
|
CUDA-MODE 第一课课后实战(下) GiantPandaLLM · 公众号 · 3D · 1 年前 · |
|
|
CUDA-MODE课程笔记 第6课: 如何优化PyTorch中的优化器 GiantPandaLLM · 公众号 · 3D · 1 年前 · |
|
|
实战Llama-3-70B RLHF-PPO训练耗时及成本 GiantPandaLLM · 公众号 · 3D · 1 年前 · |
|
|
[LLM性能优化]聊聊长文本推理性能优化方向 GiantPandaLLM · 公众号 · 3D · 1 年前 · |