|
HiFiVFS:高保真度视频换脸技术!2位层判别KV缓存实现大模型推理的极限 | 基于蒙特卡洛树搜索... AI for Research · 公众号 · · 8 月前 · |
|
重新思考MLLMs中的token缩减:朝向训练免费加速的统一范式 | 新概念学习、旧知识保留:概念瓶... AI for Research · 公众号 · · 8 月前 · |
|
艾伦研究所发布最新TULU3:推动开放语言模型后训练前沿!反馈驱动的小型语言模型的数学推理能力提升研... AI for Research · 公众号 · · 8 月前 · |
|
Marco-O1:面向开放式解决方案的开放推理模型 | 从“愚蠢”问题中学习提高大模型性能,但效果有... AI for Research · 公众号 · · 8 月前 · |
|
模型剪枝后的训练规模定律研究 | LLaVA-o1:让视觉语言模型逐步推理 | Xmodel-1.5... AI for Research · 公众号 · · 8 月前 · |
|
模型预测:幻觉与模态崩溃之间的权衡 | 腾讯发布Spider:任意到多模态大模型 | 有限数据下的微... AI for Research · 公众号 · · 8 月前 · |
|
MikuDance: 混合动力动画系统 | FP8与BF16训练在大模型中的权衡 | 利用强化学习微... AI for Research · 公众号 · · 8 月前 · |
|
通过学习动态揭示LLM推理中的泛化能力 | 大模型训练数据的调查报告 | 有效且精确的提示优化:记忆... AI for Research · 公众号 · · 8 月前 · |
|
GPT4o商业微调真的融入了新知识?Wikipedia的质量如何?Fox-1技术报告.... AI for Research · 公众号 · · 8 月前 · |
|
OpenAI开源最新评测SimpleQA:你的模型是否“知道自己知道什么”?预训练代理和世界模型的扩... AI for Research · 公众号 · · 8 月前 · |
|
实现Kaggle大师级水平的自动数据科学代理Agent来了!RuAG:规则增强生成在大模型中的应用.... AI for Research · 公众号 · · 8 月前 · |
|
大模型训练的改进条件和预训练策略!自Logits进化解码法:提高大模型的事实性... AI for Research · 公众号 · · 8 月前 · |
|
腾讯混元宣布开源2个大模型!Meta发布带隐藏结构的规模定律研究.... AI for Research · 公众号 · · 9 月前 · |
|
字节发布最新AR研究:随机自回归视觉生成技术!GameGen-X:互动式开放世界游戏视频生成 ...... AI for Research · 公众号 · · 9 月前 · |
|
字节发布stereo-talker: 音频驱动的 3D 人类合成 | 模型编辑性能下降的原因及解决方... AI for Research · 公众号 · · 9 月前 · |