|
|
超全!一文详解大型语言模型的11种微调方法 刘聪NLP · 公众号 · · 1 年前 · |
|
|
LLM实践系列-详谈Tokenizer训练细节 刘聪NLP · 公众号 · · 1 年前 · |
|
|
LLM实践系列-数据去重之Simhash&Minhash分析与实现 刘聪NLP · 公众号 · · 1 年前 · |
|
|
CodePMP:提升LLM推理能力的可扩展偏好模型预训练 刘聪NLP · 公众号 · · 1 年前 · |
|
|
全是细节 | 聊一聊做SFT的经验 刘聪NLP · 公众号 · · 1 年前 · |
|
|
Llama3.2开源:Meta发布1B和3B端侧模型、11B和90B多模态模型 刘聪NLP · 公众号 · · 1 年前 · |
|
|
长文 | Reverse-o1:OpenAI o1原理逆向工程图解 刘聪NLP · 公众号 · · 1 年前 · |
|
|
全是细节 | 聊一聊做Pretrain的经验 刘聪NLP · 公众号 · 科技媒体 · 1 年前 · |
|
|
Quest:一种以查询为中心的长文本数据合成方法 刘聪NLP · 公众号 · · 1 年前 · |
|
|
如何提升角色扮演大模型的拟人能力? 刘聪NLP · 公众号 · · 1 年前 · |
|
|
Qwen2.5系列模型开源,你值得拥有!!! 刘聪NLP · 公众号 · · 1 年前 · |
|
|
长文 | 探索基于RL的新LLM scaling范式 刘聪NLP · 公众号 · · 1 年前 · |
|
|
大模型千卡训练-经验指北 刘聪NLP · 公众号 · · 1 年前 · |
|
|
浅谈OpenAI o1的价值意义及RL 的Scaling Law 刘聪NLP · 公众号 · · 1 年前 · |
|
|
六个问题带你看懂什么是理工科学霸-OpenAI o1! 刘聪NLP · 公众号 · · 1 年前 · |
|
|
大型语言模型实战指南 刘聪NLP · 公众号 · · 1 年前 · |
|
|
DPO,RM,RLHF 傻傻分不清楚 刘聪NLP · 公众号 · · 1 年前 · |
|
|
如何获取高质量数据进行代码指令调优? 刘聪NLP · 公众号 · · 1 年前 · |
|
|
浅谈大模型角色扮演:从当红炸子鸡到无人问津 刘聪NLP · 公众号 · · 1 年前 · |