|
|
Mac变身AI超算!用Claude逆向M4芯片,纯推理引擎跑通Transformer PaperWeekly · 公众号 · 科研 · 21 小时前 · |
|
|
通义开源Mobile-Agent-v3.5:面向多端自动化操作,20+榜单实现SOTA PaperWeekly · 公众号 · 科研 · 21 小时前 · |
|
|
150B tokens实测反转!你的DeepSeek mHC可能根本不需要“m”约束 PaperWeekly · 公众号 · 科研 · 昨天 · |
|
|
63万指令微调!LEADS登Nature子刊,重塑医学文献挖掘工作流 PaperWeekly · 公众号 · 科研 · 昨天 · |
|
|
单刊年赚超2亿!中科院不再报销Nature Communications巨额版面费 PaperWeekly · 公众号 · 科研 · 4 天前 · |
|
|
多目标强化学习新突破!给GRPO加上运筹外挂,7B模型硬刚GPT-4 PaperWeekly · 公众号 · 科研 · 4 天前 · |
|
|
V4底座浮现?DeepSeek唤醒闲置网卡,「双路径」破解长上下文I/O瓶颈 PaperWeekly · 公众号 · 科研 · 5 天前 · |
|
|
WWW 2026 | 大模型推荐真懂你吗?首次揭示微调中的上下文偏差 PaperWeekly · 公众号 · 科研 · 5 天前 · |
|
|
让Claude和Kimi接管真实系统,跑个实验差点把服务器干崩了 PaperWeekly · 公众号 · 科研 · 5 天前 · |
|
|
揭开具身智能黑盒!清华等团队破译隐藏动力学密码:极限环编码行为 PaperWeekly · 公众号 · 科研 · 5 天前 · |
|
|
仅用121个参数通关10位数加法!全网狂卷Transformer参数底线 PaperWeekly · 公众号 · 科研 · 6 天前 · |
|
|
CVPR 2026 | 数据越多越分不清真假?中科院新作破解AIGC检测悖论 PaperWeekly · 公众号 · 科研 · 6 天前 · |
|
|
GitHub 2K星!Edit Banana一键解剖AI像素图,变身可编辑PPT/Drawio PaperWeekly · 公众号 · 科研 · 1 周前 · |
|
|
还在盲目堆数据?用SAE特征空间指导合成,2K样本轻松追平300K SOTA PaperWeekly · 公众号 · 科研 · 1 周前 · |
|
|
藏在海量参数背后的系统工程:7家顶尖实验室大模型训练内参 PaperWeekly · 公众号 · 科研 · 1 周前 · |
|
|
Adam如何魔改Muon?融合正交与自适应,NAMO刷新LLM训练上限 PaperWeekly · 公众号 · 科研 · 1 周前 · |
|
|
无限上下文的尽头是线性回归?MIT提出注意力匹配,KV压缩提速百倍 PaperWeekly · 公众号 · 科研 · 1 周前 · |
|
|
304个中文大模型实测出炉!首个动态诊断系统ReLE发布,评测降本70% PaperWeekly · 公众号 · 科研 · 1 周前 · |
|
|
零开销超越Adam/Muon!Google新型优化器Magma:丢弃一半梯度反夺SOTA PaperWeekly · 公众号 · 科研 · 1 周前 · |
|
|
AI也会“吃瓜”?首个声誉系统RepuNet来了,破解大模型合作崩塌难题 PaperWeekly · 公众号 · 科研 · 1 周前 · |