专栏 RSS订阅(公众号)
温馨提示:订阅专栏后它将会自动更新,无人订阅的专栏有可能不会更新。
专栏 二维码
TodayRss-海外RSS稳定源
他们也喜欢这个专栏
 • 
RSS订阅
今天看啥  ›  专栏  ›  深度图学习与大模型LLM
关注图网络、图表示学习,最近顶会顶刊动态以及机器学习基本方法,包括无监督学习、半监督学习、弱监督学习、元学习等
免责声明:本专栏仅为信息导航参考,不代表原文立场或观点。 原专栏内容版权归原作者所有,如您为原作者并希望删除该专栏,请通过 【版权申诉通道】联系我们处理。
开通 RSS极速订阅 可分钟级获得文章
VLA-Systems || 重新审视VLA的实用性:LLaVA-VLA用0.5B模型跑赢7B基线
深度图学习与大模型LLM  ·  公众号  · 大模型  ·  1 月前  · 
PRM || ReasonFlux-PRM:面向长链推理的轨迹感知过程奖励模型
深度图学习与大模型LLM  ·  公众号  · 大模型  ·  2 月前  · 
Agents自主进化 || 自进化 Agent 系统性综述:从 Model-Centric 到环境共...
深度图学习与大模型LLM  ·  公众号  · 大模型  ·  2 月前  · 
前沿追踪Agent RL || SkillRL:通过递归技能进化让 Agent 学会从经验中成长
深度图学习与大模型LLM  ·  公众号  · 大模型  ·  2 月前  · 
我们的专注力正在被谁训练,坐在屏幕这一端的我,和那个 agent 在结构上没什么两样
深度图学习与大模型LLM  ·  公众号  · 大模型  ·  2 月前  · 
二十年以后当AGI 已经成为基础设施,那时的研究生翻到我们这一代人写的 paper 和 blog,会...
深度图学习与大模型LLM  ·  公众号  · 大模型  ·  2 月前  · 
Benchmark 涨点的快乐,和真正推进理解的快乐,是两种不同的多巴胺
深度图学习与大模型LLM  ·  公众号  · 大模型  ·  2 月前  · 
研究手记 || 做研究最磨人的恰恰是那种没有外部奖励也要自己跟自己较劲的部分
深度图学习与大模型LLM  ·  公众号  · 大模型  ·  2 月前  · 
前沿追踪Agent RL || RLAnything:环境、策略与奖励模型的闭环动态强化学习框架
深度图学习与大模型LLM  ·  公众号  · 大模型  ·  2 月前  · 
前沿追踪Agent RL || SAGE: 用强化学习教 Agent 学会自我进化与技能积累
深度图学习与大模型LLM  ·  公众号  · 大模型  ·  2 月前  · 
前沿追踪Agent RL || MetaClaw:让部署中的 Agent 在使用中自主进化
深度图学习与大模型LLM  ·  公众号  · 大模型  ·  2 月前  · 
前沿追踪Agent RL || 从用户交互中对齐大模型
深度图学习与大模型LLM  ·  公众号  · 大模型  ·  2 月前  · 
前沿追踪2025 || 代码生成能自我进化吗?
深度图学习与大模型LLM  ·  公众号  · 大模型  ·  2 月前  · 
前沿追踪2026 || Claude 的“情绪”从哪来?Anthropic 揭示大模型内部情绪概念如...
深度图学习与大模型LLM  ·  公众号  · 大模型  ·  2 月前  · 
前沿追踪2026 || AutoSkill:把对话经验沉淀成可复用技能,而不是停留在记忆里
深度图学习与大模型LLM  ·  公众号  · 大模型  ·  2 月前  · 
前沿追踪2026 || OCP:用正交投影对抗稀疏扩展下的表示塌缩
深度图学习与大模型LLM  ·  公众号  · 大模型  ·  2 月前  · 
前沿追踪2026 || MemSkill:把智能体记忆操作从固定规则变成可学习、可进化的技能
深度图学习与大模型LLM  ·  公众号  · 大模型  ·  2 月前  ·