|
|
ICML 2026| 当线性注意力学会“写入前思考”:并行化的多步记忆写入 大模型智能 · 公众号 · 大模型 · 3 周前 · |
|
|
刚刚,Anthropic首个神话级Claude5正式解禁! 大模型智能 · 公众号 · 大模型 · 3 周前 · |
|
|
陈天奇团队最新开源PithTrain:Agent时代的MoE训练框架设计 大模型智能 · 公众号 · 大模型 · 3 周前 · |
|
|
马斯克39页SpaceX计划,人类史上最伟大的PPT 大模型智能 · 公众号 · 大模型 · 3 周前 · |
|
|
Codex撞脸ClaudeCode,新功能只领先11天 大模型智能 · 公众号 · 大模型 · 3 周前 · |
|
|
刚刚,姚顺雨现身!公开回应腾讯AI落后了吗? 大模型智能 · 公众号 · 大模型 · 3 周前 · |
|
|
一个月烧掉5亿美元账单之后:这项研究在问,Agent到底知不知道自己花了多少? 大模型智能 · 公众号 · 大模型 · 3 周前 · |
|
|
解决大模型训练LossSpike!重新设计激活函数SwiGLU,聊聊蚂蚁Ling模型背后的PowLU 大模型智能 · 公众号 · 大模型 · 4 周前 · |
|
|
张亦弛@清华大学-从思考到行动:智能体时代的可信AI 大模型智能 · 公众号 · 大模型 · 4 周前 · |
|
|
MiniMax新旗舰M3发布!自己干了12小时复现获奖论文,三条科技树同时点满 大模型智能 · 公众号 · 大模型 · 4 周前 · |
|
|
DDIM之父宋佳铭,宣布离职 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
· 公众号 · 大模型 · 1 月前 · |
|
|
DiffusionOPD:复旦联合通义万相提出扩散模型「在线策略蒸馏」新范式,让学⽣模型同时学会构图... 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
关于Agent Harness,我整理了一个最小版! 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
DeepSeek陈德里开发自动研究Skill,写一篇论文人类只动脑2小时 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
程子豪@北京航空航天大学:Terminal-World:面向终端智能体的大规模环境合成 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
ICLR2026|Next-ToBE:让"自信而短视"的大模型看得更远、推理更准 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
从KL的方向看SFT与RL:大模型到底是在”学会做”,还是在”学会选”? 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
谷歌CEO承认Coding落后了 大模型智能 · 公众号 · 大模型 · 1 月前 · |
|
|
OpenAI大神教你如何榨干Codex 大模型智能 · 公众号 · 大模型 · 1 月前 · |