|
|
· 公众号 · 大模型 · 4 周前 · |
|
|
· 公众号 · 大模型 · 4 周前 · |
|
|
· 公众号 · 大模型 · 4 周前 · |
|
|
· 公众号 · 大模型 · 1 月前 · |
|
|
EMNLP 2024 || 打破残差量化的“沙漏效应”:生成式检索上限为什么会被中间层语义 ID 卡... 深度图学习与大模型LLM · 公众号 · 大模型 · 1 月前 · |
|
|
· 公众号 · 大模型 · 1 月前 · |
|
|
· 公众号 · 大模型 · 1 月前 · |
|
|
前沿追踪2026 || Meta-Harness:把 LLM 系统外层代码也纳入端到端优化 深度图学习与大模型LLM · 公众号 · 大模型 · 1 月前 · |
|
|
· 公众号 · 大模型 · 1 月前 · |
|
|
· 公众号 · 大模型 · 1 月前 · |
|
|
· 公众号 · 大模型 · 1 月前 · |
|
|
前沿追踪2026 ||参考人脑中不同记忆系统的分工,把智能体记忆拆成多个功能模块 深度图学习与大模型LLM · 公众号 · 大模型 · 1 月前 · |
|
|
前沿追踪2026 || 当潜空间开始长出“符号”:AIM 如何把 V-JEPA 2 的隐表示变成可检... 深度图学习与大模型LLM · 公众号 · 大模型 · 1 月前 · |
|
|
· 公众号 · 大模型 · 1 月前 · |
|
|
大模型基础系列(1) | 无监督预训练与任务微调 || GPT-1如何开启生成式预训练范式 深度图学习与大模型LLM · 公众号 · 大模型 · 1 月前 · |
|
|
前沿追踪2026 || CLIPO:用 Contrastive Learning 提升 RLVR 泛... 深度图学习与大模型LLM · 公众号 · 大模型 · 1 月前 · |
|
|
· 公众号 · 大模型 · 1 月前 · |
|
|
· 公众号 · 大模型 · 1 月前 · |
|
|
前沿追踪2026 || 从自演化合成数据到可验证奖励强化学习:多轮交互工具调用智能体后训练方法 深度图学习与大模型LLM · 公众号 · 大模型 · 1 月前 · |
|
|
· 公众号 · 大模型 · 1 月前 · |