SparksofAGI - 公众号 - 文章列表 - 历史文章

注册登录

专栏 RSS订阅（公众号）

温馨提示：订阅专栏后它将会自动更新，无人订阅的专栏有可能不会更新。

购买VIP

购买成为VIP，可查看文章或者RSS订阅

提交新专栏

我也要提交微信公众号

专栏二维码

TodayRss-海外RSS稳定源

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

小宇宙RSS订阅方法

X平台RSS订阅方法

领英公司动态RSS订阅方法

RSS代理RSS订阅方法

Telegram频道RSS订阅方法

油管文字版RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

他们也喜欢这个专栏

•

今天看啥 › 专栏 › SparksofAGI

人工智能前沿论文解读

免责声明：本专栏仅为信息导航参考，不代表原文立场或观点。原专栏内容版权归原作者所有，如您为原作者并希望删除该专栏，请通过【版权申诉通道】联系我们处理。

最新

开通 RSS极速订阅可分钟级获得文章

Boson AI × SGLang 正式发布 Higgs Audio v3 TTS：面向语音智能体的...

SparksofAGI · 公众号 · · 2 周前 ·

大规模GPU集群与天才导师等你来！一起做有意义的大模型研究

SparksofAGI · 公众号 · · 3 周前 ·

半形式化“证书式”推理：让代码代理在不执行的前提下更可靠

SparksofAGI · 公众号 · · 3 月前 ·

异构大模型一起练：共享可验证轨迹，让每个模型都变强、成本减半

SparksofAGI · 公众号 · · 3 月前 ·

把“记忆带来的探索力”蒸馏进参数：EMPO²如何训练更会探索的智能体

SparksofAGI · 公众号 · · 3 月前 ·

从“语言扩展”到“世界建模”：统一多模态预训练的关键变量与尺度规律

SparksofAGI · 公众号 · · 3 月前 ·

终端智能体怎么“练出来”：面向可扩展训练的数据工程方法论

SparksofAGI · 公众号 · · 3 月前 ·

用“技能迁移”替代RL训练：更省成本的多智能体路由框架 SkillOrchestra

SparksofAGI · 公众号 · · 3 月前 ·

预训练“挑数据”：OPUS用优化器视角动态选token，30B训出200B的效果

SparksofAGI · 公众号 · · 4 月前 ·

有效推理链的本质：让任务“更可压缩”，用更少参数学得更好

SparksofAGI · 公众号 · · 4 月前 ·

别再存轨迹了：SkillRL 让 Agent 把经验炼成技能，还会自我进化

SparksofAGI · 公众号 · · 4 月前 ·

Transformer Q-Learning：用“注意力熵”刹住 Transformer 价值网络的...

SparksofAGI · 公众号 · · 4 月前 ·

熵为何在强化微调中“塌缩”：从单个 token 更新推导出的判别量与控熵剪裁

SparksofAGI · 公众号 · · 4 月前 ·

用 Pull Request 链训练长程智能体：daVinci-Agency 的数据合成范式

SparksofAGI · 公众号 · · 4 月前 ·

RAL：把强化学习的优化对象从“输出 token 序列”转向“内部注意力分布”

SparksofAGI · 公众号 · · 4 月前 ·

让强化学习“听懂批注”：用多轮文本反馈把能力蒸馏进单轮策略

SparksofAGI · 公众号 · · 4 月前 ·

把“旧推理”变成新起点：用离策略正确前缀加速大模型强化学习

SparksofAGI · 公众号 · · 4 月前 ·

把“不可验证文本”变成“可验证奖励”：Golden Goose 的RLVR数据扩容技巧

SparksofAGI · 公众号 · · 4 月前 ·

把 GitHub PR 变成可验证训练场：百万级软件工程环境自动构建框架

SparksofAGI · 公众号 · · 4 月前 ·

异常值不是“训练噪声”：注意力沉降与残差沉降如何借助归一化稳定 Transformer

SparksofAGI · 公众号 · · 4 月前 ·

关于移动版 · TodayRss海外 · RSS之家 · 卧龙AI搜索

今天看啥 - 公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

© 2025 ~ 沪ICP备11025650号