专栏名称: 斌叔OKmath

橙旭园CEO 教育博主教育部双创优秀导师。前微软员工。橙旭园儿童编程创始人。

购买VIP

购买成为VIP，可查看文章或者RSS订阅

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

小宇宙RSS订阅方法

X平台RSS订阅方法

领英公司动态RSS订阅方法

RSS代理RSS订阅方法

Telegram频道RSS订阅方法

油管文字版RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

TodayRss-海外RSS稳定源

相关文章推荐

南方人物周刊 · 即将截止！每天不到1.5元！半个文坛顶尖作家 ... · 6 小时前

会计雅苑 · 工资11500（六险二金+双休）2026年事 ... · 9 小时前

会计雅苑 · 前期会计差错更正公告：补缴以前年度税款 · 9 小时前

南方人物周刊 · 7年现象级，中国会讲故事的牛人又聚齐了！ · 昨天

中国会计视野 · 招生简章 | AI新范式下财务数智化转型升级课程 · 昨天

今天看啥 › 专栏 › 斌叔OKmath

正如上周所承诺的，这里是使用强化学习算法 GRPO 训练语言模型-20250211195239

斌叔OKmath · 微博 · · 2025-02-11 19:52

原文地址：访问原文地址 (快捷配置)
总结与预览地址：访问文章预览/总结
文章地址：访问文章快照

分享到微博

推荐文章

南方人物周刊 · 即将截止！每天不到1.5元！半个文坛顶尖作家来教你写作

6 小时前

会计雅苑 · 工资11500（六险二金+双休）2026年事业单位公开招聘会计人员425名（新出岗位）6月28日报名！快转给身边需要的人！

9 小时前

会计雅苑 · 前期会计差错更正公告：补缴以前年度税款

9 小时前

南方人物周刊 · 7年现象级，中国会讲故事的牛人又聚齐了！

昨天

中国会计视野 · 招生简章 | AI新范式下财务数智化转型升级课程

昨天

演讲传承 · 演讲的冲击力从哪里来

2 年前

句读 · 想起你你便存在，忘记你你就在天涯

2 年前

ScienceAI · Nature子刊，川大团队机器学习结合MD，预测蛋白质变构，助力药物研发

1 年前

上海证券报 · 蚂蚁集团领投！加码具身智能赛道

1 年前

蓝睛生活 · 央视官宣，谢娜发文回应

8 月前