专栏 RSS订阅(B站投稿视频)
温馨提示:订阅专栏后它将会自动更新,无人订阅的专栏有可能不会更新。
TodayRss-海外RSS稳定源
他们也喜欢这个专栏
 • 
RSS订阅
今天看啥  ›  专栏  ›  偷星九月333
两耳不闻窗外事,一心只搞大模型
免责声明:本专栏仅为信息导航参考,不代表原文立场或观点。 原专栏内容版权归原作者所有,如您为原作者并希望删除该专栏,请通过 【版权申诉通道】联系我们处理。
开通 RSS极速订阅 可分钟级获得文章
解读KIMI K2.5 Agent Swarm,下一代Agent主流架构
偷星九月333  ·  B站投稿视频  ·  ·  2 月前  · 
闭关一坤天,从零复现GDPO算法(英伟达出品,简单但有效),从原理到代码实现,喂饭级讲解
偷星九月333  ·  B站投稿视频  ·  ·  3 月前  · 
强化学习(verl)训练日志怎么看,今天就给你们来个保姆级的教程~
偷星九月333  ·  B站投稿视频  ·  ·  3 月前  · 
相见恨晚,原来论文还可以这样读,论文架构一览无余!
偷星九月333  ·  B站投稿视频  ·  ·  3 月前  · 
verl参数怎么看,今天就给你们来个保姆级的教程
偷星九月333  ·  B站投稿视频  ·  ·  4 月前  · 
闪电说,打字像说话一样快的高效率神器,解放你的十指
偷星九月333  ·  B站投稿视频  ·  ·  4 月前  · 
闭关一坤年,从零实现大模型左右互博之术(生成对抗,无数据RL优化),从原理讲解到代码实现,你要的全都...
偷星九月333  ·  B站投稿视频  ·  ·  4 月前  · 
Agent is all you need,verl自定义Agent Loop(python cod...
偷星九月333  ·  B站投稿视频  ·  ·  4 月前  · 
VeRL强化学习实用教程:自定义奖励计算的若干方法,从简单到复杂,覆盖所有应用需求
偷星九月333  ·  B站投稿视频  ·  ·  4 月前  · 
闭关两天半,完全从零实现大模型RL知识蒸馏(On Policy Distillation,Qwen2...
偷星九月333  ·  B站投稿视频  ·  ·  4 月前  · 
练习两天半,教你如何使用终端AI智能体iFlow CLI,从部署到使用全流程
偷星九月333  ·  B站投稿视频  ·  ·  5 月前  · 
练习两天半,完全从零开始实现DeepSeek Sparse Attention(DSA,DS-V3....
偷星九月333  ·  B站投稿视频  ·  ·  5 月前  · 
Qwen3-Next到Kimi-Linear,混合线性注意力架构超越Softmax注意力,带你深度了...
偷星九月333  ·  B站投稿视频  ·  ·  5 月前  · 
拒绝AI焦虑,X、GitHub、arXiv三个渠道打破一切AI信息障碍,做最好的自己
偷星九月333  ·  B站投稿视频  ·  ·  5 月前  · 
闭关两天半,从零实现大模型Logits知识蒸馏(Cross-Tokenizer,GLM4-9B-->...
偷星九月333  ·  B站投稿视频  ·  ·  5 月前  · 
明基RD280U-沉浸感与氛围感拉满的专业编程显示器
偷星九月333  ·  B站投稿视频  ·  ·  5 月前  · 
闭关两天半,完全从零开始实现Training-free GRPO(无需更新参数的GPRO,完全解放你...
偷星九月333  ·  B站投稿视频  ·  ·  6 月前  ·