|
大模型微调到底有没有技术含量? 刘聪NLP · 公众号 · · 12 月前 · |
|
MOE系列模型-浅谈 刘聪NLP · 公众号 · · 1 年前 · |
|
大模型预训练开源数据集-整理 刘聪NLP · 公众号 · · 1 年前 · |
|
一大堆Llama3.1-Chinese正在袭来 刘聪NLP · 公众号 · · 1 年前 · |
|
浅谈Llama3.1,从结构、训练过程、影响到数据合成 刘聪NLP · 公众号 · · 1 年前 · |
|
Llama3.1系列模型正式开源,最大405B,闭源模型的统治时代将迎来结束? 刘聪NLP · 公众号 · 科技自媒体 互联网短视频 · 1 年前 · |
|
RegMix-用回归任务解决大模型数据混合问题 刘聪NLP · 公众号 · · 1 年前 · |
|
开源真卷!Google开源Gemma 2大模型 刘聪NLP · 公众号 · · 1 年前 · |
|
让AI应用成为你的创意游乐场 - 快速搭建AI应用 刘聪NLP · 公众号 · · 1 年前 · |
|
探讨 | 大模型在传统NLP任务的使用姿势 刘聪NLP · 公众号 · · 1 年前 · |
|
数据合成方法-让模型自己说出用了哪些指令对齐数据 刘聪NLP · 公众号 · · 1 年前 · |
|
长文本生成的新技巧-KV缓存量化 刘聪NLP · 公众号 · · 1 年前 · |
|
Qwen2模型开源,你值得拥有! 刘聪NLP · 公众号 · · 1 年前 · |
|
GLM4模型开源,意料之中的尺寸,意料之外的效果 刘聪NLP · 公众号 · · 1 年前 · |
|
OpenAI新公告:GPTs向全部用户开放,底层模型是GPT-4o,但受限 刘聪NLP · 公众号 · · 1 年前 · |
|
长文 | 大模型偏好对齐全家桶 - RL侧 刘聪NLP · 公众号 · 科技创业 科技媒体 · 1 年前 · |
|
万字长文讲透智能体|智能体的架构、探索与应用 刘聪NLP · 公众号 · · 1 年前 · |