|
将Diffusion模型的推理速度提升了8倍,顺利拿到6家企业offer 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · |
|
LLM实践-支线:分布式训练框架的编程基础 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · |
|
对OpenAI o3模型的看法、思考与反思 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · |
|
DPO vs PPO:深度解读谁是LLM Alignment的未来 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · |
|
工业界主流大语言模型后训练(Post-Training)技术总结 吃果冻不吐果冻皮 · 公众号 · · 7 月前 · |
|
大模型量化技术原理:总结 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · |