青稞AI - 公众号 - 文章列表 - 历史文章

注册登录

专栏 RSS订阅（公众号）

温馨提示：订阅专栏后它将会自动更新，无人订阅的专栏有可能不会更新。

购买VIP

购买成为VIP，可查看文章或者RSS订阅

提交新专栏

我也要提交微信公众号

专栏二维码

TodayRss-海外RSS稳定源

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

小宇宙RSS订阅方法

X平台RSS订阅方法

领英公司动态RSS订阅方法

RSS代理RSS订阅方法

Telegram频道RSS订阅方法

油管文字版RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

他们也喜欢这个专栏

•

今天看啥 › 专栏 › 青稞AI

青年AI研究员idea加油站，AI开发者的新能源充电桩。

免责声明：本专栏仅为信息导航参考，不代表原文立场或观点。原专栏内容版权归原作者所有，如您为原作者并希望删除该专栏，请通过【版权申诉通道】联系我们处理。

最新

开通 RSS极速订阅可分钟级获得文章

RL算法推导！PPO -> GRPO -> DAPO -> GSPO -> SAPO

青稞AI · 公众号 · AI · 5 月前 ·

Qwen用假信号也能拿高分？虚假的RLVR如何激活隐藏记忆回路？

青稞AI · 公众号 · AI · 5 月前 ·

下周二晚8点！一起聊聊理解、生成、执行一体化的VLA大模型：InternVLA-A1

青稞AI · 公众号 · AI · 5 月前 ·

只改几个 Token，就能教会大模型新知识，还不忘旧知识？

青稞AI · 公众号 · AI · 5 月前 ·

超越精度！为什么训练-推理不一致是一个优化问题，又如何修复？

青稞AI · 公众号 · AI · 5 月前 ·

揭开 loss 看梯度 -- Diffusion RL的实际优化目标

青稞AI · 公众号 · AI · 5 月前 ·

深度！简单理解 RL 中的 KL 散度估计器：从数值估计到梯度估计

青稞AI · 公众号 · AI · 5 月前 ·

别搞混了！Reward Model ≠ Critic：PPO 中的双重评估机制解析

青稞AI · 公众号 · AI · 5 月前 ·

从传统 RL 算法应用到 LLM 定义，推导 RL 算法策略梯度及改进

青稞AI · 公众号 · AI · 5 月前 ·

如何入门具身 VLA ？

青稞AI · 公众号 · AI · 5 月前 ·

深度剖析！大模型推理系统的关键技术与架构演进

青稞AI · 公众号 · AI · 5 月前 ·

两万字长文解读！RoPE 如何让大模型拥有超长记忆

青稞AI · 公众号 · AI · 5 月前 ·

视觉模型引入频谱信息！一起聊聊从语义到像素的统一自编码 UAE

青稞AI · 公众号 · AI · 5 月前 ·

从 GRPO 到 verl，理解现代大模型 RL Infra 架构

青稞AI · 公众号 · AI · 5 月前 ·

比 EAGLE-3 快 2.5 倍！DFlash 如何利用扩散模型终结自回归瓶颈？

青稞AI · 公众号 · AI · 5 月前 ·

RLLaVA 开源！多模态大模型 RL 训练框架的设计与实践

青稞AI · 公众号 · AI · 5 月前 ·

大模型为什么会产生“离群值”？深度解析RoPE与注意力机制

青稞AI · 公众号 · AI · 5 月前 ·

实录精选！MiniMax M2.1 的 Agent 后训练技术官方解读

青稞AI · 公众号 · AI · 5 月前 ·

重新思考扩散模型蒸馏 work 的方式！周二晚8点，聊聊 Z-Image 背后的 DMD 实践

青稞AI · 公众号 · AI · 5 月前 ·

2025 Agentic RL 经验总结！这一年的弯路、暴论和下一步思考

青稞AI · 公众号 · AI · 5 月前 ·

关于移动版 · TodayRss海外 · RSS之家 · 卧龙AI搜索

今天看啥 - 公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

© 2025 ~ 沪ICP备11025650号