|
|
硬核拆解大模型,从 DeepSeek-V3 到 Kimi K2 ,一文看懂 LLM 主流架构 机器学习社区 · 公众号 · · 8 月前 · |
|
|
字节都到三面了,结果挂在vLLM原理上。。。 机器学习社区 · 公众号 · · 8 月前 · |
|
|
小白学大模型:Qwen3 嵌入和重排序模型 机器学习社区 · 公众号 · · 10 月前 · |
|
|
百度二面要我手搓FP16精度,差点跪了... 机器学习社区 · 公众号 · · 10 月前 · |
|
|
腾讯算法三面终极拷问:为什么 GRPO 容易出现 reward 崩塌? 机器学习社区 · 公众号 · · 12 月前 · |
|
|
技术祛魅帖:一文看懂LLM / 智能体 / 工作流 和 MCP 机器学习社区 · 公众号 · · 12 月前 · |
|
|
行业落地分享:大模型在小红书推荐的应用 机器学习社区 · 公众号 · · 1 年前 · |
|
|
快手二面拷打:训练100B模型要多少显存? 机器学习社区 · 公众号 · · 1 年前 · |