|
|
花 100 美元训练自己的 ChatGPT?Karpathy 新开源项目 nanochat 让大模型... NeuralTalk · 公众号 · · 6 月前 · |
|
|
端侧 NPU 的 LLM 测试时计算扩展:硬件感知块量化与 LUT 优化实现 19.0×GEMM与 ... NeuralTalk · 公众号 · · 6 月前 · |
|
|
破解 LLM 推理非确定性核心:攻克浮点非结合性,构建端到端确定性架构 NeuralTalk · 公众号 · · 7 月前 · |
|
|
OpenAI 块稀疏权重下的卷积与 GEMM GPU Kernel:较 cuBLAS/cuSPARS... NeuralTalk · 公众号 · · 7 月前 · |
|
|
NVIDIA 技术博客:CUDA 全局内存的合并访问,如何最大化 GPU 带宽 NeuralTalk · 公众号 · · 7 月前 · |
|
|
NVIDIA 技术博客:CUDA 全局内存的合并访问,如何最大化 GPU 带宽 NeuralTalk · 公众号 · · 7 月前 · |