|
所有人都可以大规模预训练MAE - 16倍加速! 极市平台 · 公众号 · · 4 月前 · |
|
DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,一台Mac可跑 极市平台 · 公众号 · · 4 月前 · |
|
DeepSeek-R1 技术剖析:没有强化学习基础也能看懂的 PPO & GRPO 极市平台 · 公众号 · · 4 月前 · |
|
160万奖金池,大厂强强加盟!2025英特尔人工智能创新应用大赛等你来报名 极市平台 · 公众号 · · 4 月前 · |
|
真正的LLM Agent 极市平台 · 公众号 · 科技自媒体 科技媒体 · 4 月前 · |
|
腾讯混元、英伟达都发混合架构模型,Mamba-Transformer要崛起吗? 极市平台 · 公众号 · · 4 月前 · |
|
极市直播预告|CVPR2025:端到端自动驾驶中的多模态轨迹生成 极市平台 · 公众号 · 科技自媒体 · 4 月前 · |
|
CVPR 2025满分论文:开源三维生成框架Craftsman3D 革新三维资产生成与编辑 极市平台 · 公众号 · · 4 月前 · |
|
最近爆火的MCP(Model Context Protocol),读这一篇就够了 极市平台 · 公众号 · · 4 月前 · |
|
CVPR 2025 | 加快22倍!Meta提出EdgeTAM:基于SAM 2的高效视频分割模型,性... 极市平台 · 公众号 · · 4 月前 · |
|
诚邀参加 | 青岛AICC"用昇腾玩转DeepSeek、Qwen开发实战"集训营活动 极市平台 · 公众号 · · 4 月前 · |
|
详解vLLM和SGLang awq dequantize kernel的魔法 极市平台 · 公众号 · · 4 月前 · |
|
AI Agent 发展史:从 RL 驱动到大模型驱动 |AIR 2025 极市平台 · 公众号 · · 4 月前 · |
|
自回归模型还能这么玩?kaiming团队:我们真的不需要矢量量化|自回归视觉生成模型系列解读 极市平台 · 公众号 · · 4 月前 · |
|
CVPR 2025 满分论文|清华提出TSP3D:基于语言引导空间剪枝的高效3D视觉Groundin... 极市平台 · 公众号 · · 4 月前 · |
|
结合代码聊聊FlashAttentionV3前向过程的原理 极市平台 · 公众号 · · 4 月前 · |
|
CVPR 2025 | 清华提出MambaIRv2:图像复原超强SOTA模型 极市平台 · 公众号 · · 4 月前 · |
|
尝试基于小模型(0.5B)复现DeepSeek-R1的思维链 极市平台 · 公众号 · · 4 月前 · |