|
SFT洗数据,有多少细节? 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · |
|
考古OpenAI RLHF基石之作:探索RL和RM阶段的Scaling Law 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · |
|
详解大模型RLHF过程(配代码解读) 吃果冻不吐果冻皮 · 公众号 · · 8 月前 · |
|
大模型量化技术原理:Atom、QuaRot 吃果冻不吐果冻皮 · 公众号 · · 9 月前 · |
|
生成式AI搜索的局限性及提升建议 吃果冻不吐果冻皮 · 公众号 · 科技自媒体 互联网安全 · 9 月前 · |
|
大模型量化技术原理:KIVI、IntactKV、KVQuant 吃果冻不吐果冻皮 · 公众号 · · 9 月前 · |
|
一文了解RTX4090 GPU八卡机的“市场乱象” 吃果冻不吐果冻皮 · 公众号 · · 9 月前 · |
|
开源大模型推理引擎现状及常见推理优化方法总结 吃果冻不吐果冻皮 · 公众号 · · 9 月前 · |
|
vLLM这一年的新特性以及后续规划(总结版!) 吃果冻不吐果冻皮 · 公众号 · · 9 月前 · |
|
全参微调与LoRA的区别,及7种LoRA变种方法解析 吃果冻不吐果冻皮 · 公众号 · 科技自媒体 AI · 9 月前 · |
|
LLaMA系列一直在假装开源... 吃果冻不吐果冻皮 · 公众号 · · 9 月前 · |
|
vLLM性能分析案例 吃果冻不吐果冻皮 · 公众号 · · 9 月前 · |
|
大模型推理优化技术-KV Cache量化 吃果冻不吐果冻皮 · 公众号 · · 9 月前 · |
|
复现 OpenAI o1 的一小步:Steiner 开源模型解析 吃果冻不吐果冻皮 · 公众号 · · 9 月前 · |
|
OpenAI o1之下,我们技术该何去何从 吃果冻不吐果冻皮 · 公众号 · · 9 月前 · |
|
训练VLM(视觉语言模型)的经验 吃果冻不吐果冻皮 · 公众号 · · 9 月前 · |