专栏 RSS订阅(公众号)
温馨提示:订阅专栏后它将会自动更新,无人订阅的专栏有可能不会更新。
专栏 二维码
TodayRss-海外RSS稳定源
他们也喜欢这个专栏
 • 
RSS订阅
今天看啥  ›  专栏  ›  青稞AI
青年AI研究员idea加油站,AI开发者的新能源充电桩。
免责声明:本专栏仅为信息导航参考,不代表原文立场或观点。 原专栏内容版权归原作者所有,如您为原作者并希望删除该专栏,请通过 【版权申诉通道】联系我们处理。
开通 RSS极速订阅 可分钟级获得文章
OpenAI、xAI、Thinking Machines 都在用的 AI 个人主页究竟是什么?
青稞AI  ·  公众号  · AI  ·  3 月前  · 
从 dx/dt 到图论,论 Agent 与世界模型的终极形态
青稞AI  ·  公众号  · AI  ·  3 月前  · 
RL算法推导!PPO -> GRPO -> DAPO -> GSPO -> SAPO
青稞AI  ·  公众号  · AI  ·  3 月前  · 
Qwen用假信号也能拿高分?虚假的RLVR如何激活隐藏记忆回路?
青稞AI  ·  公众号  · AI  ·  3 月前  · 
下周二晚8点!一起聊聊理解、生成、执行一体化的VLA大模型:InternVLA-A1
青稞AI  ·  公众号  · AI  ·  3 月前  · 
只改几个 Token,就能教会大模型新知识,还不忘旧知识?
青稞AI  ·  公众号  · AI  ·  3 月前  · 
超越精度!为什么训练-推理不一致是一个优化问题,又如何修复?
青稞AI  ·  公众号  · AI  ·  3 月前  · 
揭开 loss 看梯度 -- Diffusion RL的实际优化目标
青稞AI  ·  公众号  · AI  ·  3 月前  · 
深度!简单理解 RL 中的 KL 散度估计器:从数值估计到梯度估计
青稞AI  ·  公众号  · AI  ·  3 月前  · 
从传统 RL 算法应用到 LLM 定义,推导 RL 算法策略梯度及改进
青稞AI  ·  公众号  · AI  ·  4 月前  · 
如何入门具身 VLA ?
青稞AI  ·  公众号  · AI  ·  4 月前  · 
深度剖析!大模型推理系统的关键技术与架构演进
青稞AI  ·  公众号  · AI  ·  4 月前  · 
从 GRPO 到 verl,理解现代大模型 RL Infra 架构
青稞AI  ·  公众号  · AI  ·  4 月前  · 
比 EAGLE-3 快 2.5 倍!DFlash 如何利用扩散模型终结自回归瓶颈?
青稞AI  ·  公众号  · AI  ·  4 月前  · 
RLLaVA 开源!多模态大模型 RL 训练框架的设计与实践
青稞AI  ·  公众号  · AI  ·  4 月前  · 
实录精选!MiniMax M2.1 的 Agent 后训练技术官方解读
青稞AI  ·  公众号  · AI  ·  4 月前  ·