|
QVQ-72B,如期而至!继QWQ后,通义千问又开源视觉推理大模型! 刘聪NLP · 公众号 · 科技自媒体 · 7 月前 · |
|
对OpenAI o3模型的看法、思考与反思 刘聪NLP · 公众号 · · 7 月前 · |
|
实测!最新端侧全模态大模型Megrez-3B-Omni 刘聪NLP · 公众号 · · 7 月前 · |
|
聊聊对强化微调(RFT)的理解及看法 刘聪NLP · 公众号 · · 7 月前 · |
|
瞎聊: SFT模型为何不如Pretrain模型 刘聪NLP · 公众号 · · 8 月前 · |
|
该来的还是会来,Qwen团队开源推理大模型-QwQ!!! 刘聪NLP · 公众号 · · 8 月前 · |
|
2024年,做大模型增量预训练(continue pretrain)的注意事项!!! 刘聪NLP · 公众号 · · 8 月前 · |
|
测测Kimi新开的k0-math,你是数学模型,但我就测文本 刘聪NLP · 公众号 · · 8 月前 · |
|
写了一个月提示词(Prompt)后的感悟!! 刘聪NLP · 公众号 · · 8 月前 · |
|
聊一聊做角色扮演大模型的经验 刘聪NLP · 公众号 · · 8 月前 · |
|
LLM实践系列-详聊OpenRLHF中的各种Loss 刘聪NLP · 公众号 · · 8 月前 · |
|
LLM实践系列-聊聊大模型SFT的数据清洗过程有多繁琐? 刘聪NLP · 公众号 · · 8 月前 · |
|
也许是2024年最值得一去的大模型国内年会! 刘聪NLP · 公众号 · · 8 月前 · |