|
|
Anthropic参与新论文:大模型为何学得更多?答案藏在Scaling里 PaperWeekly · 公众号 · 科研 · 2 周前 · |
|
|
不要再卷同源蒸馏了!简单微调分词方式,轻松实现跨架构OPD PaperWeekly · 公众号 · 科研 · 2 周前 · |
|
|
8个Agent也能稳定收敛,信任域约束重塑多Agentic工作流 | ICML 2026 PaperWeekly · 公众号 · 科研 · 2 周前 · |
|
|
超越TurboQuant!KV Cache压到真2-bit,长上下文推理又快又稳 PaperWeekly · 公众号 · 科研 · 2 周前 · |
|
|
Agent团队开始自我进化,MetaAgent-X把协作训进基座模型 PaperWeekly · 公众号 · 科研 · 2 周前 · |
|
|
直播预告 | UCLA田园教授:大语言模型智能体框架中的安全挑战 PaperWeekly · 公众号 · 科研 · 2 周前 · |
|
|
国内首次!千万级深思考SFT开源,MiniCPM5-1B核心数据公开 PaperWeekly · 公众号 · 科研 · 2 周前 · |
|
|
Agent一定要训练吗?4层Harness让性能平均提升88.5% PaperWeekly · 公众号 · 科研 · 2 周前 · |
|
|
会生成世界,不等于理解世界:20个世界模型大考来了 PaperWeekly · 公众号 · 科研 · 3 周前 · |
|
|
ICLR 2026 | 从POD到互信息:PDE求解迎来神经正交分解新框架 PaperWeekly · 公众号 · 科研 · 3 周前 · |
|
|
发不了Nature?没关系,你投的Rubbish被它翻牌了 PaperWeekly · 公众号 · 科研 · 3 周前 · |
|
|
Cell Press直播来了:顶刊大牛齐聚,解密自主导航前沿技术 PaperWeekly · 公众号 · 科研 · 3 周前 · |
|
|
无问芯穹RLinf加持DreamZero世界动作模型,实现4倍训练提速 PaperWeekly · 公众号 · 科研 · 3 周前 · |
|
|
ACL 2026 | 7000种语言怎么教?清华阿里找准语义瓶颈,通关多语言安全 PaperWeekly · 公众号 · 科研 · 3 周前 · |
|
|
为什么语音大模型一开口,还是像客服? PaperWeekly · 公众号 · 科研 · 3 周前 · |
|
|
ICML 2026 | 大模型为何越改越稳?中科大揭开终身归一化黑箱 PaperWeekly · 公众号 · 科研 · 3 周前 · |
|
|
10M参数也能跑ARC与数独,Bengio团队押注「多轨迹推理」 PaperWeekly · 公众号 · 科研 · 3 周前 · |
|
|
智能体也要有App Store?上交大 × OPPO构建海量智能体生态 PaperWeekly · 公众号 · 科研 · 3 周前 · |
|
|
CVPR 2026丹佛见!蚂蚁这场“AGI攀登者之夜”可以先码住 PaperWeekly · 公众号 · 科研 · 4 周前 · |
|
|
OPD为何如此高效?中科大揭开参数动力学密码,后训练提速3倍 PaperWeekly · 公众号 · 科研 · 4 周前 · |