|
|
错题本 × LLM:人机协作如何炼成“最严代码考官” 觉察流 · 公众号 · · 9 月前 · |
|
|
OpenAgentSafety 框架:AI 智能体安全评估的创新实践 觉察流 · 公众号 · · 9 月前 · |
|
|
世界模型的变革之道:PAN 架构的突破 觉察流 · 公众号 · · 9 月前 · |
|
|
OctoThinker:借“中期训练”之力,缩小 Llama 和 Qwen 模型的差距 觉察流 · 公众号 · · 10 月前 · |
|
|
终结奖励欺骗?Google Deepmind 提出 Crome 框架(万字) 觉察流 · 公众号 · · 10 月前 · |
|
|
推理锚点:解码LLM推理的关键节点(可解释性研究) 觉察流 · 公众号 · · 10 月前 · |
|
|
RLPR:突破验证器限制,解锁 LLM 通用推理新潜能 觉察流 · 公众号 · · 10 月前 · |
|
|
深度解析 MEM1:开启智能体长时序高效交互之门(万字) 觉察流 · 公众号 · · 10 月前 · |