|
【源头活水】5%参数比肩DeepSeek满血R1!北大“小”模型靠分合蒸馏,打破推理成本下限 人工智能前沿讲习 · 公众号 · · 2 月前 · |
|
【他山之石】与Gemini Diffusion共振!首个扩散式「发散思维链」来了 人工智能前沿讲习 · 公众号 · · 2 月前 · |
|
【他山之石】ICML 2025 | 大模型深度思考新范式:交替「推理-擦除」解决所有可计算问题 人工智能前沿讲习 · 公众号 · · 2 月前 · |