|
|
FlashAttention算法之美:极简推导版 包包算法笔记 · 公众号 · AI · 1 年前 · |
|
|
ACL 2024中RAG论文整理和简析 包包算法笔记 · 公众号 · AI · 1 年前 · |
|
|
图解大模型训练系列:序列并行2,DeepSpeed Ulysses 包包算法笔记 · 公众号 · AI · 1 年前 · |
|
|
AI搜索的16个局限性和提升建议 包包算法笔记 · 公众号 · AI · 1 年前 · |
|
|
图解大模型训练系列:序列并行 包包算法笔记 · 公众号 · AI · 1 年前 · |
|
|
大模型SFT数据选择方法综述 包包算法笔记 · 公众号 · AI · 1 年前 · |
|
|
复现 OpenAI o1 的一小步:Steiner 开源模型解析 包包算法笔记 · 公众号 · AI · 1 年前 · |
|
|
Perplexity CEO揭秘:不训大模型、关键在于检索、排序、编排 包包算法笔记 · 公众号 · AI · 1 年前 · |
|
|
字节大模型搞推荐,有业务收益了 包包算法笔记 · 公众号 · AI · 1 年前 · |
|
|
OpenAI 12月发布最新模型Orion?Altman又辟谣 包包算法笔记 · 公众号 · AI · 1 年前 · |
|
|
LLM洗数据:数据或许比算法更重要?大模型剪枝中的校准数据 包包算法笔记 · 公众号 · AI · 1 年前 · |
|
|
LLM洗数据:怎么做Continue Pretrain的数据 包包算法笔记 · 公众号 · AI · 1 年前 · |
|
|
LLM洗数据:数据去重之Simhash&Minhash分析与实现 包包算法笔记 · 公众号 · AI · 1 年前 · |
|
|
小红书用大模型搞推荐 包包算法笔记 · 公众号 · AI · 1 年前 · |
|
|
· 公众号 · AI · 1 年前 · |
|
|
Claude 3.5,学会了用电脑!遥遥领先openAI 包包算法笔记 · 公众号 · AI 科技自媒体 · 1 年前 · |
|
|
如何用一个统一的视角,分析RLHF下的各种算法? 包包算法笔记 · 公众号 · AI · 1 年前 · |
|
|
Yann LeCun最新演讲:基本上不做LLM了 包包算法笔记 · 公众号 · AI · 1 年前 · |
|
|
万字长文梳理LLM+RLHF的脉络 包包算法笔记 · 公众号 · AI · 1 年前 · |
|
|
· 公众号 · AI · 1 年前 · |