今天看啥  ›  专栏  ›  运筹OR帷幄

LLM+推理决策 | MURKA,针对运筹优化问题的多奖励强化学习+知识蒸馏框架 (NeurIPS ...

运筹OR帷幄  · 公众号  ·  · 2025-12-09 20:00
    

原文地址:访问原文地址
总结与预览地址:访问总结与预览
文章地址: 访问文章快照