专栏 RSS订阅(公众号)
温馨提示:订阅专栏后它将会自动更新,无人订阅的专栏有可能不会更新。
专栏 二维码
TodayRss-海外RSS稳定源
他们也喜欢这个专栏
 • 
RSS订阅
今天看啥  ›  专栏  ›  吃果冻不吐果冻皮
专注于AI工程化(LLM、MLOps、LLMOps、RAG、Agent)落地。
免责声明:本专栏仅为信息导航参考,不代表原文立场或观点。 原专栏内容版权归原作者所有,如您为原作者并希望删除该专栏,请通过 【版权申诉通道】联系我们处理。
开通 RSS极速订阅 可分钟级获得文章
1.5B推理模型新SOTA,RL训练新解法打破「简单题过拟合、难题学不动」的魔咒
吃果冻不吐果冻皮  ·  公众号  ·  ·  7 月前  · 
真实、残酷的AI就业冲击——从一篇极其精彩的哈佛论文聊起
吃果冻不吐果冻皮  ·  公众号  ·  ·  7 月前  · 
三万字长文!读懂模型量化的核心原理与挑战
吃果冻不吐果冻皮  ·  公众号  ·  ·  7 月前  · 
Kimi K2 如何实现高效 RL 参数更新?Checkpoint Engine技术详解
吃果冻不吐果冻皮  ·  公众号  ·  ·  7 月前  · 
MIT最新研究!RL为什么比SFT遗忘的更少?
吃果冻不吐果冻皮  ·  公众号  ·  ·  7 月前  · 
谁在拖慢你的RL?别怪显卡,错的可能是你的PG-loss
吃果冻不吐果冻皮  ·  公众号  ·  ·  7 月前  · 
LLM Inference高效Debug方法汇总
吃果冻不吐果冻皮  ·  公众号  ·  ·  8 月前  · 
对比 MXFP4 与 NVFP4
吃果冻不吐果冻皮  ·  公众号  ·  ·  8 月前  · 
OpenAI研究 : 语言模型为什么会有"幻觉"? 可以去除幻觉吗?
吃果冻不吐果冻皮  ·  公众号  ·  ·  8 月前  · 
挑战Claude4的8B Agent!NUS提出AgenTracer:面向多智能体系统的失败归因
吃果冻不吐果冻皮  ·  公众号  ·  ·  8 月前  · 
动态微调 DFT:从强化学习的视角改进监督微调 SFT
吃果冻不吐果冻皮  ·  公众号  ·  ·  8 月前  · 
美团AI:LongCat-Flash技术报告解读
吃果冻不吐果冻皮  ·  公众号  ·  ·  8 月前  · 
DeepSeek最新发文,回应国家新规:公开V3/R1训练全部细节!
吃果冻不吐果冻皮  ·  公众号  ·  ·  8 月前  ·