|
|
将端侧大模型进行到底-MiniCPM3-4B开源 刘聪NLP · 公众号 · · 1 年前 · |
|
|
Qwen2-VL:Qwen系列已在开源的路上一骑绝尘 刘聪NLP · 公众号 · · 1 年前 · |
|
|
这段时间搞大模型的血和泪 刘聪NLP · 公众号 · · 1 年前 · |
|
|
综述 | 大模型的可控文本生成 刘聪NLP · 公众号 · 科技自媒体 · 1 年前 · |
|
|
探讨大模型预训练与微调之间的相互作用 刘聪NLP · 公众号 · · 1 年前 · |
|
|
大模型时代,什么样的算法工程师更吃香? 刘聪NLP · 公众号 · · 1 年前 · |
|
|
没有等来Qwen2.5,但等来了Qwen2-Math 刘聪NLP · 公众号 · · 1 年前 · |
|
|
大模型微调到底有没有技术含量? 刘聪NLP · 公众号 · · 1 年前 · |
|
|
MOE系列模型-浅谈 刘聪NLP · 公众号 · · 1 年前 · |
|
|
大模型预训练开源数据集-整理 刘聪NLP · 公众号 · · 1 年前 · |
|
|
一大堆Llama3.1-Chinese正在袭来 刘聪NLP · 公众号 · · 1 年前 · |
|
|
浅谈Llama3.1,从结构、训练过程、影响到数据合成 刘聪NLP · 公众号 · · 1 年前 · |
|
|
Llama3.1系列模型正式开源,最大405B,闭源模型的统治时代将迎来结束? 刘聪NLP · 公众号 · 科技自媒体 互联网短视频 · 1 年前 · |
|
|
RegMix-用回归任务解决大模型数据混合问题 刘聪NLP · 公众号 · · 1 年前 · |
|
|
开源真卷!Google开源Gemma 2大模型 刘聪NLP · 公众号 · · 1 年前 · |
|
|
让AI应用成为你的创意游乐场 - 快速搭建AI应用 刘聪NLP · 公众号 · · 1 年前 · |