|
大模型在逻辑推理中是否依赖记忆力?SciPIP: 基于大模型的科学论文创意生成器.... AI for Research · 公众号 · · 9 月前 · |
|
大模型中的突变学习现象研究 | 如何区分大模型出现的幻觉属于无知还是真的犯错?批量大小与模型及数据规... AI for Research · 公众号 · · 9 月前 · |
|
HoPE: 一种新型位置编码,无需长期衰减,增强上下文意识和外推能力!一个无需调优的可控人物视频合成... AI for Research · 公众号 · · 9 月前 · |
|
微软发布最新研究:MoE仅提升记忆效果无法提高推理能力!大模型有效上下文长度不足的本质原因是什么? AI for Research · 公众号 · · 9 月前 · |
|
大模型真正遗忘了吗?一种简单方法恢复已遗忘的知识 | 推理缩放定律的简单模型研究 AI for Research · 公众号 · · 9 月前 · |
|
百川发布大模型对齐技术报告 | 仅需要32个令牌就可以表示视频?如何评估强化学习范式下的奖励模型? AI for Research · 公众号 · · 9 月前 · |
|
羊毛党的福利来了!书生大模型第4期社区公开课正式起航!了解最新前沿大模型应用的必备课程 AI for Research · 公众号 · · 9 月前 · |
|
Anthropic最新研究:教学模型如何平衡抵抗与接受说服 | 大模型跨层KV共享研究... AI for Research · 公众号 · · 9 月前 · |
|
基于GPT-4o的o1模型推理模式比较探究 | 多语言语言模型的缩放定律 | DreamVideo-... AI for Research · 公众号 · · 9 月前 · |
|
英伟达:上下文表示最多能够编码多远距离的上下文?压缩后训练权重量化的大模型扩展能力规律.... AI for Research · 公众号 · · 9 月前 · |
|
大规模数据选择再思考:随机选择几乎是你所需要的全部 | CoMAT:链条数学注释思维改进数学推理..... AI for Research · 公众号 · · 9 月前 · |
|
Baichuan-Omni技术报告技术报告发布!关于更高维度RoPE注意力模型的令牌距离建模能力研究 AI for Research · 公众号 · · 9 月前 · |
|
字节发布新研究:扩散视频模型DiT的规模缩放规律!大模型是否具备逻辑推理能力? SAT 解决问题的理... AI for Research · 公众号 · · 9 月前 · |
|
Pixstral 12B多模态大模型论文上线!大模型内部词典的奥秘探索 | 大模型量化缩放规律... AI for Research · 公众号 · · 9 月前 · |
|
智源发布最新视频世界模型Emu3:仅预测下一个令牌,探索多模态智能的未来!如何选择最具影响力的训练子... AI for Research · 公众号 · · 10 月前 · |
|
记忆女神:高效服务数百万上下文长度LLM推理请求的并行化策略!MIO:基于多模态令牌的基础模型 AI for Research · 公众号 · · 10 月前 · |
|
如何判别大模型是否秘密使用了你的数据?Time-MoE:百亿级时间序列基础模型的构建与预训练.... AI for Research · 公众号 · · 10 月前 · |
|
探究语言模型中潜在思维链向量的发现 | 后续概率作为奖励信号对语言模型进行对齐 | 面向小时级视频理... AI for Research · 公众号 · · 10 月前 · |
|
推进小语言模型对复杂推理任务的能力 | 探索大模型训练中本地SGD的缩放规律 | 大模型中高效的知识... AI for Research · 公众号 · · 10 月前 · |