专栏 RSS订阅(公众号)
温馨提示:订阅专栏后它将会自动更新,无人订阅的专栏有可能不会更新。
专栏 二维码
TodayRss-海外RSS稳定源
他们也喜欢这个专栏
 • 
RSS订阅
今天看啥  ›  专栏  ›  青稞AI
青年AI研究员idea加油站,AI开发者的新能源充电桩。
免责声明:本专栏仅为信息导航参考,不代表原文立场或观点。 原专栏内容版权归原作者所有,如您为原作者并希望删除该专栏,请通过 【版权申诉通道】联系我们处理。
开通 RSS极速订阅 可分钟级获得文章
如何有效管理上下文?看看Anthropic Agent上下文工程经验
青稞AI  ·  公众号  · AI  ·  6 月前  · 
大模型RL的Scaling Law和最佳实践
青稞AI  ·  公众号  · AI  ·  6 月前  · 
谈一谈DeepSeek-OCR和Glyph用视觉压缩思路,模拟人类记忆遗忘机制,突破LLM上下文窗口...
青稞AI  ·  公众号  · AI  ·  6 月前  · 
RLHF调参实战手册:实用Trick、现象排查与解决思路
青稞AI  ·  公众号  · AI  ·  6 月前  · 
详解Muon优化器谱球内的最速下降
青稞AI  ·  公众号  · AI  ·  6 月前  · 
为什么线性注意力要加Short Conv?
青稞AI  ·  公众号  · AI  ·  6 月前  · 
下周二晚8点!一起来聊聊:如何统一大型语言模型后训练SFT & RL?
青稞AI  ·  公众号  · AI  ·  6 月前  · 
如何解决大模型RL训练中的Bubble问题?
青稞AI  ·  公众号  · AI  ·  6 月前  · 
如何管理Agent的记忆?强化学习驱动模型使用工具更新Memory
青稞AI  ·  公众号  · AI  ·  6 月前  · 
最新多模态大模型的训练策略对比
青稞AI  ·  公众号  · AI  ·  6 月前  · 
港大&Kimi提出OpenCUA:用于构建 Computer-Use Agent 的开源框架
青稞AI  ·  公众号  · AI  ·  6 月前  · 
从工程设计角度分析一下 veRL、OpenRLHF
青稞AI  ·  公众号  · AI  ·  6 月前  · 
最新研究!你的Agent可能在“错误进化”~
青稞AI  ·  公众号  · AI  ·  6 月前  · 
以信息熵的角度解构RL!大白话讲从“熵”到“RL”的探索之路
青稞AI  ·  公众号  · AI  ·  6 月前  · 
周二晚8点!一起系统聊聊面向推理模型的 RL 研究
青稞AI  ·  公众号  · AI  ·  7 月前  · 
为什么我们需要 Context Engineering?
青稞AI  ·  公众号  · AI  ·  7 月前  · 
HKU MMLab最新开源SRUM!基于统一多模态模型的训练后奖励微调
青稞AI  ·  公众号  · AI  ·  7 月前  · 
美团 LongCat-Flash-Thinking 技术报告解读
青稞AI  ·  公众号  · AI  ·  7 月前  · 
MCTS为什么在LLM任务上不好用?
青稞AI  ·  公众号  · AI  ·  7 月前  · 
抛弃adamw!Muon 优化器训练稳态的模型权重大小应该设为多少?
青稞AI  ·  公众号  · AI  ·  7 月前  ·