专栏名称: AI新文

AI顶刊顶会新论文一号通，每天推送，助您时刻站在AI研究最前沿。包括：人工智能基础、交叉应用、脑认知与类脑智能、机器学习、模式识别与计算机视觉、自然语言处理、知识工程与数据挖掘、跨媒体与人机交互、智能机器人与系统、智能芯片与计算等。

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

RSSHub订阅方法

微博RSS订阅方法

即刻RSS订阅方法

ICML 2025 | 大语言模型-相关论文12篇

AI新文 · 公众号 · 科技媒体 · 2025-07-28 07:00

主要观点总结

本文主要介绍了关于大语言模型（LLM）的多个研究内容，包括高效长上下文建模、鲁棒性、安全评估、水印、模拟、推理等方面的创新。文章还涉及LLM的错误相关性、演示预选择、剪枝、偏差检测、量化等方面的研究。最后，文章提出了多种方法以提高LLM的性能和效率。

提出了一种新的KV缓存优化范式LaCache，用于LLM高效准确生成推理。LaCache解决了远程建模中的两个关键挑战：健壮的远程功能和不耗尽内存（OOM）的连续生成。

研究了多模态大语言模型（MLLM）在真实世界场景中的幻觉现象，并从模态冲突的角度进行了形式化定义和数据分析。提出了三种方法来缓解模态冲突引起的幻觉，并在MMMC数据集上进行了实验验证。

利用广泛接受的安全基准对各种量化技术和校准数据集进行安全评估。为解决识别出的安全漏洞，提出了一种量化感知安全修补框架Q-resafe，以有效恢复量化LLM的安全能力。

提出了BiMark，一种新的水印框架，通过三个关键创新实现了在保持文本质量的同时嵌入消息并检测水印：比特翻转无偏重加权机制、多层架构和信息编码方法。

介绍了G-Sim，一种混合框架，通过结合LLM的结构设计和严格的经验校准来自动化模拟器的构建。G-Sim利用LLM提出并细化模拟器的核心组件和因果关系，然后使用灵活的校准技术估计其参数。

提出了AR-Bench，一种新型基准测试，旨在评估LLM的主动推理能力。AR-Bench通过模拟真实世界场景测量常识、逻辑和符号推理挑战的性能。

研究了LLM中的错误相关性，使用多个LLM进行大规模经验评估，并确定了共享架构和提供者等因素对模型错误相关性的影响。

提出了FEEDER，一种预选择框架，用于识别训练数据中最具代表性的演示，并根据特定LLM进行定制。该框架通过构造代表子集来提高效率，并与ICL中的下游演示选择策略无缝集成。

介绍了一种新的剪枝方法DLP，该方法自适应地确定每个层的相对重要性，通过集成模型权重与输入激活信息，在高稀疏水平上保持模型性能。

研究了LLM的偏差问题，并提出了B-score来检测主观、随机问题的偏差。B-score提高了验证准确性，可以有效地用于接受或拒绝LLM的答案。

提出了一种新的量化方法GuidedQuant，它将来自端部损失的梯度信息集成到量化目标中，同时保持输出信道内的交叉权重相关性。

从率失真理论的角度建立了LLM量化的基础，提出了一种基于简单率失真优化的量化技术，可以扩展到包含数千亿个权重参数的模型。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
推荐产品: 推荐产品
文章地址：访问文章快照

分享到微博