青稞AI - 公众号 - 文章列表 - 历史文章

注册登录

专栏 RSS订阅（公众号）

温馨提示：订阅专栏后它将会自动更新，无人订阅的专栏有可能不会更新。

购买VIP

购买成为VIP，可查看文章或者RSS订阅

提交新专栏

我也要提交微信公众号

专栏二维码

TodayRss-海外RSS稳定源

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

小宇宙RSS订阅方法

X平台RSS订阅方法

Telegram频道RSS订阅方法

油管文字版RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

他们也喜欢这个专栏

•

今天看啥 › 专栏 › 青稞AI

青年AI研究员idea加油站，AI开发者的新能源充电桩。

免责声明：本专栏仅为信息导航参考，不代表原文立场或观点。原专栏内容版权归原作者所有，如您为原作者并希望删除该专栏，请通过【版权申诉通道】联系我们处理。

最新

开通 RSS极速订阅可分钟级获得文章

谈谈 DeepSeek-R1 和 V3.2 的后训练以及 RL 训练稳定性的问题

青稞AI · 公众号 · AI · 1 月前 ·

Claude Code 源码逆向工程与系统性分析！Harness Engineering: 基于 C...

青稞AI · 公众号 · AI · 1 月前 ·

从任意视角理解和生成世界！和 NTU 博后廖康，一起聊聊统一多模态空间智能大模型 Puffin

青稞AI · 公众号 · AI · 1 月前 ·

从传统 RL 的视角看大模型 RLVR

青稞AI · 公众号 · AI · 1 月前 ·

大模型RL算法梳理：从全量词元到部分词元的路径演化

青稞AI · 公众号 · AI · 1 月前 ·

近半年 On-Policy Distillation 的三大主流方向：一个方法解决两道难题

青稞AI · 公众号 · AI · 1 月前 ·

长文干货！深度解析第三代 RLVR 模型的训练过程

青稞AI · 公众号 · AI · 1 月前 ·

下周二晚8点！一起聊聊 OpenClaw-RL：让你的龙虾在使用中自适应变强

青稞AI · 公众号 · AI · 1 月前 ·

大模型的下半场是什么？林俊旸：从 Reasoning Thinking 到 Agentic Thin...

青稞AI · 公众号 · AI · 1 月前 ·

对话上海交通大学助理教授杨学：如何做好系统性科研

青稞AI · 公众号 · AI · 1 月前 ·

从 ORM 到 PRM，Reasoning 模型诞生：思维链、思维树、思维图、MCTS、 Self-...

青稞AI · 公众号 · AI · 1 月前 ·

真机RL成本太高？一起聊聊 RISE：让机器人在世界模型的“想象”中自主进化

青稞AI · 公众号 · AI · 1 月前 ·

LLM Post-Training 全景指南：从 RLHF 到 GRPO 再到 Agentic RL

青稞AI · 公众号 · AI · 1 月前 ·

长文干货！从 SFT 到 PPO 全解：拒绝采样、Reward Model、REINFORCE、Ac...

青稞AI · 公众号 · AI · 1 月前 ·

MOE 架构如何做 SFT 和 RL？聊聊 post-training 难点与经验

青稞AI · 公众号 · AI · 1 月前 ·

干货！万字长文解析 Agent 框架中的上下文管理策略

青稞AI · 公众号 · AI · 1 月前 ·

直播预告！从 Depth Scaling 到 Width Scaling，聊聊 WideSeek-R...

青稞AI · 公众号 · AI · 1 月前 ·

Agentic RL 训练核心问题：环境建模、学习信号、异步数据流、策略优化和基础设施

青稞AI · 公众号 · AI · 1 月前 ·

从推理架构的角度，谈谈 Attention Residual 架构一些背后的想法

青稞AI · 公众号 · AI · 1 月前 ·

如何成为超级个体（严肃脸）？这场活动回答你

青稞AI · 公众号 · AI · 1 月前 ·

关于移动版 · TodayRss海外 · RSS之家 · 卧龙AI搜索

今天看啥 - 公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

© 2025 ~ 沪ICP备11025650号