|
Qwen3-Coder-Flash来咯🚀 AINLP · 公众号 · · 2 天前 · |
|
DeepSeek-R1群相对策略优化(GRPO)算法深度解析 AINLP · 公众号 · · 2 天前 · |
|
微信基础业务推荐算法研究员(社招/校招) AINLP · 公众号 · · 2 天前 · |
|
从万亿参数到智能体:Kimi K2 技术报告全景解读,附英中对照版 AINLP · 公众号 · · 1 周前 · |
|
阿里发布全新 Non-thinking 模型 Qwen3-235B-A22B-Instruct-25... AINLP · 公众号 · · 1 周前 · |
|
verl RFT: 从数据构建到GRPO训练 AINLP · 公众号 · · 1 周前 · |