|
|
超越快手flow-GRPO!阿里通义联合提出图像生成RL新范式VGPO 智猩猩AI · 公众号 · · 4 月前 · |
|
|
写在后 Langchain 时代 智猩猩AI · 公众号 · · 4 月前 · |
|
|
超越GRPO!阿里提出VSPO增强工具调用推理智能体,并引入 PRS重构RL奖励 智猩猩AI · 公众号 · · 5 月前 · |
|
|
较vLLM有效吞吐量飙升33倍!浙大&阿里提出增强型LLM高效推理框架,首token延迟降低95% 智猩猩AI · 公众号 · · 5 月前 · |
|
|
在 Arm 服务器上实作 llama.cpp 分布式大模型推理全流程|公开课 智猩猩AI · 公众号 · · 5 月前 · |
|
|
超越LoRA及最先进变体!AMD提出大模型微调新范式,模拟全量微调中的梯度更新 智猩猩AI · 公众号 · · 5 月前 · |