|
|
别再刷 HumanEval 了!北大团队 RepoZero 揭示:LLM 从零建库成功率不足 60% 青稞AI · 公众号 · AI · 昨天 · |
|
|
如何合成 Agentic 事实性 SFT / Mid-train 数据? 青稞AI · 公众号 · AI · 昨天 · |
|
|
深度!DeepSeek-V4 中的 MegaMoE,细致的 Overlap 通信和计算延迟方案 青稞AI · 公众号 · AI · 2 天前 · |
|
|
OPD 到底在优化什么?周六上午10点,一起聊聊其中的三类典型失败以及修复路径 青稞AI · 公众号 · AI · 3 天前 · |
|
|
对比离线蒸馏!为什么选择 OPD? 青稞AI · 公众号 · AI · 3 天前 · |
|
|
OPD 深度解析:从数学推导到 DeepSeek V4、SWIFT 与 verl 实践 青稞AI · 公众号 · AI · 4 天前 · |
|
|
和翁家翌(OpenAI)一样的idea!如何让 AI 全自动刷榜——可能的下一个强化学习范式 青稞AI · 公众号 · AI · 5 天前 · |
|
|
OpenAI 翁家翌:“启发式学习”的强化学习新范式 青稞AI · 公众号 · AI · 6 天前 · |
|
|
直播预告!下周二晚8点,一起聊聊大模型强化学习的 Scaling Law 青稞AI · 公众号 · AI · 1 周前 · |
|
|
ICML'26 Spotlight|犹豫就会败北:用 T²PO 稳定多轮 Agentic RL 训练 青稞AI · 公众号 · AI · 1 周前 · |
|
|
干货!什么是 Harness Engineering?运转原理又是怎样的? 青稞AI · 公众号 · AI · 1 周前 · |
|
|
经验分享!如何进行 Mid-train 以及 SFT 的 Query 筛选 青稞AI · 公众号 · AI · 1 周前 · |
|
|
工业级 LLM 预训练数据工程的关键实践! 青稞AI · 公众号 · AI · 1 周前 · |
|
|
直播预告!和SGLang核心开发者一起聊聊 DeepSeek V4 模型在 SGLang 中的系统级... 青稞AI · 公众号 · AI · 1 周前 · |
|
|
DeepSeek-V4 的并行策略和计算通信遮掩 青稞AI · 公众号 · AI · 1 周前 · |
|
|
从 MLA 到 High-rank MQA:DeepSeek-V4 为什么选择了最“极致”的参数路径... 青稞AI · 公众号 · AI · 1 周前 · |
|
|
DeepSeek-V4 技术报告背后的 TileLang:如何高效实现大模型中的小算子 青稞AI · 公众号 · AI · 2 周前 · |
|
|
ACL 2026|告别昂贵的知识图谱:ZoomRAG 让 RAG 像地图一样"缩放" 青稞AI · 公众号 · AI · 2 周前 · |