|
|
ICLR 2026 | 告别单一记忆粒度!MemGAS 让智能体不再“转头就忘” PaperWeekly · 公众号 · 科研 · 1 月前 · |
|
|
林俊旸千问收官之作?告别偏科,用Token强化学习统一大模型能力 PaperWeekly · 公众号 · 科研 · 1 月前 · |
|
|
AIME近翻倍!北航团队提出「弱驱动学习」,弱智能体反向带飞强模型 PaperWeekly · 公众号 · 科研 · 1 月前 · |
|
|
首个Token为何沦为数值垃圾桶?LeCun团队解构大模型底层机制 PaperWeekly · 公众号 · 科研 · 1 月前 · |
|
|
人大 × 字节团队破解muP理论分歧:用谱条件统一宽深Scaling PaperWeekly · 公众号 · 科研 · 1 月前 · |
|
|
普林斯顿陈丹琦团队:免微调破解长文本衰退,推理性能提升25% PaperWeekly · 公众号 · 科研 · 1 月前 · |
|
|
ICLR 2026 | 图模型也能合并?多任务融合框架G-Merging,仅5%参数反超微调 PaperWeekly · 公众号 · 科研 · 1 月前 · |
|
|
Mamba作者再发神作:套娃式加速解码SSD,突破vLLM/SGLang极限 PaperWeekly · 公众号 · 科研 · 1 月前 · |
|
|
NeurIPS 2025 | 当系统算法遇上机器学习:GUARD开启学习增强缓存新范式 PaperWeekly · 公众号 · 科研 · 1 月前 · |
|
|
一句话生成LoRA、长文档瞬间内化:大模型更新成本还能这样摊销? PaperWeekly · 公众号 · 科研 · 1 月前 · |
|
|
直播预告 | 约翰斯·霍普金斯大学肖超玮教授:迈向安全可靠的AI智能体 PaperWeekly · 公众号 · 科研 · 1 月前 · |
|
|
Mac变身AI超算!用Claude逆向M4芯片,纯推理引擎跑通Transformer PaperWeekly · 公众号 · 科研 · 1 月前 · |
|
|
通义开源Mobile-Agent-v3.5:面向多端自动化操作,20+榜单实现SOTA PaperWeekly · 公众号 · 科研 · 1 月前 · |
|
|
150B tokens实测反转!你的DeepSeek mHC可能根本不需要“m”约束 PaperWeekly · 公众号 · 科研 · 2 月前 · |
|
|
63万指令微调!LEADS登Nature子刊,重塑医学文献挖掘工作流 PaperWeekly · 公众号 · 科研 · 2 月前 · |
|
|
单刊年赚超2亿!中科院不再报销Nature Communications巨额版面费 PaperWeekly · 公众号 · 科研 · 2 月前 · |
|
|
多目标强化学习新突破!给GRPO加上运筹外挂,7B模型硬刚GPT-4 PaperWeekly · 公众号 · 科研 · 2 月前 · |
|
|
V4底座浮现?DeepSeek唤醒闲置网卡,「双路径」破解长上下文I/O瓶颈 PaperWeekly · 公众号 · 科研 · 2 月前 · |
|
|
WWW 2026 | 大模型推荐真懂你吗?首次揭示微调中的上下文偏差 PaperWeekly · 公众号 · 科研 · 2 月前 · |
|
|
让Claude和Kimi接管真实系统,跑个实验差点把服务器干崩了 PaperWeekly · 公众号 · 科研 · 2 月前 · |