|
|
FlashAttention-4正式发布:算法流水线大改,矩阵乘法级速度 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · |
|
|
告别纯奖励试错!二次尝试+反思蒸馏,复杂任务提升81% 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · |
|
|
聊聊蚂蚁 Ling 2.5 Lightning Attention 和 MLA 混合线性架构改造实践 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · |
|
|
字节清华智能体自动写CUDA内核,比torch.compile加速2.11倍 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · |
|
|
Dense、MoE之外第三条Scaling路径:交大提出JTok模块,省1/3算力 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · |
|
|
训练加速40倍、打破“不可能三角”:MiniMax Agent RL 架构解密 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · |
|
|
高效搞定学术公式!LlamaFactory微调 Qwen2.5-VL 实现 LaTeX 精准转换 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · |
|
|
大厂实战中,如何判断SFT到什么程度开始做RL 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · |
|
|
From Traditional RL to LLM RL 理论推导与工程改进 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · |
|
|
GLM-5技术报告:从Vibe Coding迈向Agentic Engineering 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · |
|
|
为什么说IT人是最易实现躺平的最优人选之一 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · |
|
|
毕业十年:从技术为王到资产配置为王 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · |
|
|
从零开始构建自进化智能体的心路历程 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · |
|
|
云端部署 OpenClaw:打造 24 小时“数字生命”助手 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · |
|
|
少用 sense 挑战 math!如何把 post train 做好,聊聊后训练方法论 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · |
|
|
一张表串讲LLM-RL中KL散度正则的正确与错误用法 吃果冻不吐果冻皮 · 公众号 · · 2 月前 · |
|
|
一次详细的Agent落地实战复盘!!! 吃果冻不吐果冻皮 · 公众号 · · 3 月前 · |
|
|
模型「漂移」新范式,何恺明新作让生成模型无须迭代推理 吃果冻不吐果冻皮 · 公众号 · · 3 月前 · |
|
|
Big Model Smell:Kimi K2.5 背后的 VLM 训练哲学与“N+1”范式 吃果冻不吐果冻皮 · 公众号 · · 3 月前 · |
|
|
我的AI研究这十一年:从零论文到英伟达 吃果冻不吐果冻皮 · 公众号 · · 3 月前 · |