青稞AI - 公众号 - 文章列表 - 历史文章

注册登录

专栏 RSS订阅（公众号）

温馨提示：订阅专栏后它将会自动更新，无人订阅的专栏有可能不会更新。

购买VIP

购买成为VIP，可查看文章或者RSS订阅

提交新专栏

我也要提交微信公众号

专栏二维码

TodayRss-海外RSS稳定源

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

小宇宙RSS订阅方法

X平台RSS订阅方法

领英公司动态RSS订阅方法

RSS代理RSS订阅方法

Telegram频道RSS订阅方法

油管文字版RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

他们也喜欢这个专栏

•

今天看啥 › 专栏 › 青稞AI

青年AI研究员idea加油站，AI开发者的新能源充电桩。

免责声明：本专栏仅为信息导航参考，不代表原文立场或观点。原专栏内容版权归原作者所有，如您为原作者并希望删除该专栏，请通过【版权申诉通道】联系我们处理。

最新

开通 RSS极速订阅可分钟级获得文章

周二晚8点！一起聊聊RLinf-USER：面向现实世界机器人在线策略学习的统一且可扩展系统

青稞AI · 公众号 · AI · 3 月前 ·

ROLL 团队分享：面向多轮交互 Agentic 场景的 Rollback 课程学习机制探索与实践

青稞AI · 公众号 · AI · 3 月前 ·

深度拆解！RLHF 泛化与收敛的可证明界

青稞AI · 公众号 · AI · 3 月前 ·

Agentic RL：解耦 Reasoning 与 Tool-use

青稞AI · 公众号 · AI · 3 月前 ·

staleness很大的时候，如何保证offpolicy-rl训练稳定性

青稞AI · 公众号 · AI · 4 月前 ·

周六上午10点！聊聊Dr. Kernel如何突破大模型GPU Kernel生成的多轮RL训练瓶颈？

青稞AI · 公众号 · AI · 4 月前 ·

七篇论文！深度理解 On-Policy Distillation 在算法和工程上的最新探索

青稞AI · 公众号 · AI · 4 月前 ·

从 ResNet 到 Hyper-Connections，再到 mHC

青稞AI · 公众号 · AI · 4 月前 ·

FLUX已经“懂物理”了？南洋理工最新成果，让「抠图贴纸」升级成「真实融入」

青稞AI · 公众号 · AI · 4 月前 ·

聊聊蚂蚁 Ling 2.5 Lightning Attention 和 MLA 混合线性架构改造实践

青稞AI · 公众号 · AI · 4 月前 ·

对话浙大软件学院“百人计划”研究员彭思达：如何从保研小白成长为CCF优博？

青稞AI · 公众号 · AI · 4 月前 ·

从 DeepSeek 的 Dualpath 看推理如何高效用好网络

青稞AI · 公众号 · AI · 4 月前 ·

从“手推策略梯度定理”开始：基于公式推导理解RL的创新本质

青稞AI · 公众号 · AI · 4 月前 ·

下周二晚8点！一起聊聊 RL 训练的线性轨迹，揭示 LLM 强化学习中的高效捷径

青稞AI · 公众号 · AI · 4 月前 ·

聚焦统一多模态学习范式！CVPR 2026 官方 Workshop（A2A-MML）正式开启投稿

青稞AI · 公众号 · AI · 4 月前 ·

大厂实战中，如何判断SFT到什么程度开始做RL

青稞AI · 公众号 · AI · 4 月前 ·

Minimax 团队分享：M2.5 模型训练背后，关于 Agent RL 系统的思考

青稞AI · 公众号 · AI · 4 月前 ·

聊聊 Agentic RL 热门话题：Off-policyness，Sample Efficienc...

青稞AI · 公众号 · AI · 4 月前 ·

LLM RL 训练轨迹竟然是线性的？Miaow Lab 最新工作：无需继续训练，直接“预测”未来模型...

青稞AI · 公众号 · AI · 4 月前 ·

ICLR 2026｜引入多臂老虎机，在有限评测预算下高效搜索多 Agent 结构

青稞AI · 公众号 · AI · 4 月前 ·

关于移动版 · TodayRss海外 · RSS之家 · 卧龙AI搜索

今天看啥 - 公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

© 2025 ~ 沪ICP备11025650号