专栏 RSS订阅(公众号)
温馨提示:订阅专栏后它将会自动更新,无人订阅的专栏有可能不会更新。
专栏 二维码
他们也喜欢这个专栏
 • 
RSS订阅
今天看啥  ›  专栏  ›  吃果冻不吐果冻皮
专注于AI工程化(LLM、MLOps、LLMOps、RAG、Agent)落地。
免责声明:本专栏仅为信息导航参考,不代表原文立场或观点。 原专栏内容版权归原作者所有,如您为原作者并希望删除该专栏,请通过 【版权申诉通道】联系我们处理。
开通 RSS极速订阅 可分钟级获得文章
R1 的一些认知:4 个经典误区
吃果冻不吐果冻皮  ·  公众号  ·  ·  4 月前  · 
批判性看待R1训练(基础模型和强化学习)中的坑
吃果冻不吐果冻皮  ·  公众号  ·  ·  4 月前  · 
一文了解DeepSeek及应用场景
吃果冻不吐果冻皮  ·  公众号  ·  ·  4 月前  · 
这篇GPU学习笔记,详细整理了其工作原理、编程模型和架构设计
吃果冻不吐果冻皮  ·  公众号  ·  ·  4 月前  · 
万字长文总结多模态大模型后训练
吃果冻不吐果冻皮  ·  公众号  ·  ·  4 月前  · 
字节 DAPO 技术报告有感!大模型 RL 细节为王
吃果冻不吐果冻皮  ·  公众号  ·  ·  4 月前  · 
聊聊强化学习发展这十年
吃果冻不吐果冻皮  ·  公众号  ·  ·  4 月前  · 
DeepSeek R1之后的推理大模型后训练增强技术解析
吃果冻不吐果冻皮  ·  公众号  ·  ·  4 月前  · 
刚刚!腾讯正式推出混元-T1:业界首个Transformer-Mamba 推理大模型
吃果冻不吐果冻皮  ·  公众号  ·  ·  4 月前  · 
全景解读 LLM Posting-Train(后训练)技术
吃果冻不吐果冻皮  ·  公众号  ·  ·  4 月前  · 
探究大模型微调 Lora 的不同形态: AdaLora、 AsLora、 PiSSA、 DoRA
吃果冻不吐果冻皮  ·  公众号  ·  ·  4 月前  · 
万字长文讲透 RAG 在实际落地场景中的优化
吃果冻不吐果冻皮  ·  公众号  ·  ·  4 月前  · 
AI 推理场景的痛点和解决方案
吃果冻不吐果冻皮  ·  公众号  ·  ·  4 月前  · 
尝试基于0.5B小模型复现DeepSeek-R1的思维链
吃果冻不吐果冻皮  ·  公众号  ·  ·  4 月前  ·