|
语言模型会通过RLHF误导人类?苹果发布最新研究用小模型初始化加速大模型的预训练... AI for Research · 公众号 · · 10 月前 · |
|
Qwen2.5系列模型论文发布:数学、代码、多模态全揭秘!长上下文扩展和大模型泛化的研究.... AI for Research · 公众号 · · 10 月前 · |
|
英伟达发布NVLM:最新前沿多模态大模型!GPT-O1能否消灭所有Bug?自注意力限制了基于大模型的... AI for Research · 公众号 · · 10 月前 · |
|
CPL:关键规划步骤学习提升LLM在推理任务中的泛化能力 AI for Research · 公众号 · · 10 月前 · |
|
斯坦福发布合成连续预训练方法!解决少样本学习特定事实问题 | 多模态模型的规模定律假设 | 复旦发布... AI for Research · 公众号 · · 10 月前 · |
|
基于真实数据来生成合成数据与筛选的方法研究 | 稳定语言模型预训练方法 | 更快的Speech-LL... AI for Research · 公众号 · · 10 月前 · |
|
谷歌发布20倍加速大模型的预训练方法:学习、专注和复习!LLaMA-Omni:与大模型无缝的语音交互... AI for Research · 公众号 · · 10 月前 · |
|
谷歌:代码预训练如何影响语言模型任务性能?提升预训练数据质量:基于困惑度相关性 | 突破规模定律:神... AI for Research · 公众号 · 科技媒体 · 10 月前 · |
|
如何提高代码LLM的表现?基于高质量数据强化的代码指令微调 | Open-MAGVIT2:一种向自动... AI for Research · 公众号 · 科技媒体 · 10 月前 · |
|
仅需100条样本即可实现LLM在未知数据分布上的泛化?数据规模对语言模型表现的影响:以微调翻译大模型... AI for Research · 公众号 · · 11 月前 · |
|
代码预训练数据的秘密:高质量数据的定义和作用.... AI for Research · 公众号 · · 11 月前 · |
|
语言模型操作系统的压缩机检索器架构研究 | OLMoE:开放专家混合语言模型 | 统一端到端模型实现... AI for Research · 公众号 · · 11 月前 · |
|
下一个词预测并不是最佳?港城大提出NDP(下一个分布预测)| 大模型中迁移学习的缩放规律研究 | 训... AI for Research · 公众号 · 科技自媒体 科技媒体 · 11 月前 · |
|
本周大模型Top热门论文精选 —— 24年第35期 AI for Research · 公众号 · · 11 月前 · |
|
Mini-Omni 发布!语言模型能听、说也能实时思考!通过批判链式思维提升大模型的推理能力 | ... AI for Research · 公众号 · · 11 月前 · |
|
统一RLHF、PPO、DPO和KTO方法:广义隐式奖励函数 | Hand1000: 仅使用1000... AI for Research · 公众号 · 科技自媒体 科技媒体 · 11 月前 · |
|
突发!Anthropic官宣公开Claude系统提示词,透明新纪元开启! AI for Research · 公众号 · · 11 月前 · |
|
探索合成数据替代真实数据潜力 | 链式思维提示方法的统计基础揭秘 | 大模型无偏好对齐中的逆Q*,超... AI for Research · 公众号 · · 11 月前 · |
|
大模型微调的终极指南:从基础到突破综述 | 1-Bit FQT:将全量化训练极限推到极致 | 百度发... AI for Research · 公众号 · · 11 月前 · |
|
Less for More:通过自动化自我整理训练语料库增强偏好学习!基于提示工程的LLM路径规划是... AI for Research · 公众号 · · 11 月前 · |