|
|
从ROPE到Yarn, 一条通用公式速通长文本大模型中的位置编码 刘聪NLP · 公众号 · · 1 年前 · |
|
|
如何让 RLHF 训练更稳定? 刘聪NLP · 公众号 · · 1 年前 · |
|
|
长文 | 大模型Post-Training总结 刘聪NLP · 公众号 · · 1 年前 · |
|
|
回顾2024:与LLM又相伴一年的经历与思考 刘聪NLP · 公众号 · · 1 年前 · |
|
|
QVQ-72B,如期而至!继QWQ后,通义千问又开源视觉推理大模型! 刘聪NLP · 公众号 · 科技自媒体 · 1 年前 · |
|
|
对OpenAI o3模型的看法、思考与反思 刘聪NLP · 公众号 · · 1 年前 · |
|
|
实测!最新端侧全模态大模型Megrez-3B-Omni 刘聪NLP · 公众号 · · 1 年前 · |
|
|
聊聊对强化微调(RFT)的理解及看法 刘聪NLP · 公众号 · · 1 年前 · |