青稞AI - 公众号 - 文章列表 - 历史文章

注册登录

专栏 RSS订阅（公众号）

温馨提示：订阅专栏后它将会自动更新，无人订阅的专栏有可能不会更新。

购买VIP

购买成为VIP，可查看文章或者RSS订阅

提交新专栏

我也要提交微信公众号

专栏二维码

TodayRss-海外RSS稳定源

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

小宇宙RSS订阅方法

X平台RSS订阅方法

领英公司动态RSS订阅方法

RSS代理RSS订阅方法

Telegram频道RSS订阅方法

油管文字版RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

他们也喜欢这个专栏

•

今天看啥 › 专栏 › 青稞AI

青年AI研究员idea加油站，AI开发者的新能源充电桩。

免责声明：本专栏仅为信息导航参考，不代表原文立场或观点。原专栏内容版权归原作者所有，如您为原作者并希望删除该专栏，请通过【版权申诉通道】联系我们处理。

最新

开通 RSS极速订阅可分钟级获得文章

从 GLM/Qwen 看: Agentic RL 最新进展

青稞AI · 公众号 · AI · 20 小时前 ·

On-Policy Self-Distillation：LLM利用隐式用户反馈定向纠错与持续学习

青稞AI · 公众号 · AI · 昨天 ·

直播预告！聊聊 DPA & LLaVA-HUD v4：多模态大模型的深度预对齐与高效视觉编码优化

青稞AI · 公众号 · AI · 2 天前 ·

大模型真的会模拟人类用户吗？中科院软件所、快手推出首个真实世界全链路用户行为模拟基准 OmniBeh...

青稞AI · 公众号 · AI · 2 天前 ·

就从来没人质疑过 OPD 的 reward 设计吗？我们发现了 log 本身就是问题，也许就不该用！

青稞AI · 公众号 · AI · 3 天前 ·

Lilian Weng 最新硬核长文：万字拆解 Scaling Laws，大模型训练的“黄金法则”

青稞AI · 公众号 · AI · 4 天前 ·

【征稿通知】ECCV 2026 Workshop | 多模态大语言模型统一理解与生成（MUCG）

青稞AI · 公众号 · AI · 4 天前 ·

强化学习与流模型：Offline RL 与策略提取：多模态分布与条件均值

青稞AI · 公众号 · AI · 4 天前 ·

大模型后训练：从轨迹分布到 Fisher 约束

青稞AI · 公众号 · AI · 6 天前 ·

直播预告！大模型后训练，如何实现百万级 LoRA 策略的训练与推理？

青稞AI · 公众号 · AI · 1 周前 ·

为什么 Pretrain Loss相同，但下游任务表现却天差地别？

青稞AI · 公众号 · AI · 1 周前 ·

深入理解 Agentic RL 中的行为崩塌现象

青稞AI · 公众号 · AI · 1 周前 ·

xOPD 演进｜梳理近期 OPD 的改进工作：哪些是同一个问题换说法、哪些是动了不同的模块

青稞AI · 公众号 · AI · 1 周前 ·

直播预告！聊聊 VeRL-Omni：基于 VeRL 及 vLLM-Omni 构建的多模态生成模型开源...

青稞AI · 公众号 · AI · 1 周前 ·

MTP 为什么有效，又为什么能成为 LLM 标配？深度讲解 MTP 的模型结构细节

青稞AI · 公众号 · AI · 1 周前 ·

把投机采样讲透：以 SGLang 中的 EAGLE-2 为例

青稞AI · 公众号 · AI · 1 周前 ·

ACL 2026｜SFT 为何总是学习失败？也不是所有 SFT 失败都该加 epoch！教你修复 S...

青稞AI · 公众号 · AI · 1 周前 ·

World Model 的大一统还很远，闭环进化更近！

青稞AI · 公众号 · AI · 1 周前 ·

实录精选｜On-Policy Distillation专题：与RL 的本质区别、全词表监督、跨模型/...

青稞AI · 公众号 · AI · 2 周前 ·

ACL 2026 | CoT 真的是越多越好？混元提出 E-GRM，让大模型“该省则省、该花则花...

青稞AI · 公众号 · AI · 2 周前 ·

关于移动版 · TodayRss海外 · RSS之家 · 卧龙AI搜索

今天看啥 - 公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

© 2025 ~ 沪ICP备11025650号