|
微软 Phi-4:小模型的大智慧——技术详解及简单测评 吃果冻不吐果冻皮 · 公众号 · · 6 月前 · |
|
LLM基础之长度外推技术 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · |
|
计算DeepSeekV3训练的MFU 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · |
|
o1复现的一点点心得 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · |
|
第19期-大模型书籍赠送活动 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · |
|
游凯超:我与vLLM的2024 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · |
|
将Diffusion模型的推理速度提升了8倍,顺利拿到6家企业offer 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · |
|
LLM实践-支线:分布式训练框架的编程基础 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · |
|
对OpenAI o3模型的看法、思考与反思 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · |