|
|
🤔什么?SFT、DAgger、离线 RL 和 OPD,竟然是同一张 2×2 表格上的四个格子! 青稞AI · 公众号 · AI · 2 周前 · |
|
|
直播预告!代替 MLA,无需从头训练,H100/H20 自适应的高效注意力机制 青稞AI · 公众号 · AI · 2 周前 · |
|
|
还在用 2D 空间训具身?南洋理工 MMLab 提出 4D 具身世界模拟器,构建虚拟与现实的时空桥梁... 青稞AI · 公众号 · AI · 2 周前 · |
|
|
清华最新提出全新 VLM 架构 DPA:让多模态大模型先“对齐”,再“理解”! 青稞AI · 公众号 · AI · 2 周前 · |
|
|
音频编辑模型全军覆没!多机构联合发布MMAE:首个通用音频编辑测评基准 青稞AI · 公众号 · AI · 2 周前 · |
|
|
直播预告!聊聊腾讯混元最新开源的 UniRL:面向统一多模态模型的分布式 RL 后训练框架 青稞AI · 公众号 · AI · 2 周前 · |
|
|
视觉 FLOPs 减半!清华最新成果 LLaVA-UHD v4,突破高分辨率多模态大模型的视觉编码效... 青稞AI · 公众号 · AI · 2 周前 · |
|
|
当多智能体不再只是“搭流程”:UnityMAS-O 想把 LLM Multi-Agent 真正训练起... 青稞AI · 公众号 · AI · 3 周前 · |
|
|
让 Agent 自己优化 CUDA kernel,并在 MLSys 2026 FlashInfer ... 青稞AI · 公众号 · AI · 3 周前 · |
|
|
陈天奇团队最新开源 PithTrain:Agent 时代的 MoE 训练框架设计 青稞AI · 公众号 · AI · 3 周前 · |
|
|
上海 AI Lab 最新开源 AgentDoG 1.5:面向完整执行轨迹的轻量可扩展 Agent 安... 青稞AI · 公众号 · AI · 3 周前 · |
|
|
直播预告!减少推理部署开销,如何将 Post-Trained MoE 迁移为高效动态 MoE? 青稞AI · 公众号 · AI · 3 周前 · |
|
|
slime v0.3.0 发布: 重新思考面向 Agent 时代的 RL 训练框架 青稞AI · 公众号 · AI · 3 周前 · |
|
|
给 Agent RL 加个“事后复盘”:StepOPSD 让模型精准找到“哪一步走错了”? 青稞AI · 公众号 · AI · 3 周前 · |
|
|
深入解析 LLM 推理中的 Decode Batch 内部负载不均问题 青稞AI · 公众号 · AI · 3 周前 · |
|
|
直播预告!从 ARPO,到 AEPO,再到 Agent-World:探索通用智能体训练的可行路径 青稞AI · 公众号 · AI · 4 周前 · |
|
|
大模型后训练:梯度视角下的方法分野,数学上差别到底在哪? 青稞AI · 公众号 · AI · 4 周前 · |
|
|
解决大模型训练 Loss Spike!重新设计激活函数 SwiGLU,聊聊蚂蚁 Ling 模型背后的... 青稞AI · 公众号 · AI · 4 周前 · |
|
|
不改模型,也能提升垂域 Agent?4 层 Harness 即可带来 88.5% 平均提升 青稞AI · 公众号 · AI · 4 周前 · |
|
|
实录精选!直面 OPD 训练困境,如何破解三类典型失败与修复路径? 青稞AI · 公众号 · AI · 4 周前 · |