|
DeepSeek异构&分布式部署:全平台+国产GPU支持,你值得拥有! PaperAgent · 公众号 · · 5 月前 · |
|
Agent圈的DeepSeek,牛津大学Agentic Reasoning框架显著提升深度研究能力 PaperAgent · 公众号 · · 5 月前 · |
|
X-R1: 不到50元,人人都能复现0.5B Aha Moment PaperAgent · 公众号 · · 5 月前 · |
|
7G显存,训练自己的DeepSeek-R1,GRPO资源暴降80% PaperAgent · 公众号 · · 6 月前 · |
|
清华大学DeepSeek:从入门到精通(不跑路) PaperAgent · 公众号 · · 6 月前 · |
|
仅1k样本超越o1,媲美DeepSeek-R1蒸馏模型,李飞飞新作s1发布 PaperAgent · 公众号 · · 6 月前 · |
|
RL崛起,SFT已死?仅用1/140成本,批判微调CFT媲美DeepSeek-R1复现模型 PaperAgent · 公众号 · · 6 月前 · |
|
微软开源大模型MarS:直接模拟了整个金融市场 PaperAgent · 公众号 · · 6 月前 · |
|
让DeepSeek-R1/o1思考 “走心” ?腾讯AI深度拆解 PaperAgent · 公众号 · · 6 月前 · |