专栏名称: AI新文

AI顶刊顶会新论文一号通，每天推送，助您时刻站在AI研究最前沿。包括：人工智能基础、交叉应用、脑认知与类脑智能、机器学习、模式识别与计算机视觉、自然语言处理、知识工程与数据挖掘、跨媒体与人机交互、智能机器人与系统、智能芯片与计算等。

购买VIP

购买成为VIP，可查看文章或者RSS订阅

提交新专栏

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

小宇宙RSS订阅方法

X平台RSS订阅方法

油管文字版RSS订阅方法

RSSHub订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

TodayRss-海外RSS稳定源

人工智能伦理、安全与治理-论文12篇（2025年9月）

AI新文 · 公众号 · · 2025-09-18 07:00

主要观点总结

本文主要介绍了多个关于人工智能、安全、机器学习领域的文章，包括模型的安全性问题、深度学习模型的异常检测、神经后门检测、安全警报处理等的最新研究进展。

关键观点总结

关键观点1: 乱序推送保护新文的策略和基于Deeplfash等技术处理机制。

微信公众号开始试行乱序推送，为及时获取AI新文，需将特定公众号设为星标。最新的技术处理机制如基于Deeplfash等的策略也在被研究和应用。

关键观点2: 保护修剪模型的分散联合蒸馏的优势和Ring Distill技术的特点。

Ring Distill是一种新型的DFD算法，专为跨竖井联邦环境设计，解决了现有DFD算法的局限性，包括自动模型修剪机制以进一步提高隐私保护和减少通信开销。

关键观点3: 差分隐私中的公平感知客户选择和支付确定的挑战和解决方案。

在差分隐私的联邦学习中，客户的数据隐私态度由他们的隐私预算量化。为确保公平，需考虑客户的异构隐私预算并联合选择参与者。新的拍卖机制实现了包括个体合理性、预算平衡等在内的期望属性。

关键观点4: 增强用户撤销的云数据共享系统的灵活性。

为了提高撤销用户访问特定密文或其他用户密钥时的效率，引入边缘服务器辅助的密钥刺穿技术和密钥拆分技术。

关键观点5: 多认证的单一证明在Web3环境中的应用和优势。

基于fNIZK的去中心化匿名功能证书（DAFC）方案允许用户为不同访问策略下的服务生成单个证明。DAFC的可链接性有效减轻了凭证滥用风险。

关键观点6: FLUTE的安全两方计算框架在大型语言模型中的应用和优势。

FLUTE是首个基于FSS的部分Transformer加密的LLM 2PC推理框架。它通过优化通信和矩阵乘法协议来增强安全性，在大型语言模型中的实验结果表明其显著优于当前技术。

关键观点7: 深度伪造检测的全面调查和未来展望。

对深度伪造检测进行了全面的调查和分析，包括驱动DeepFake扩散的关键因素、检测方法、新兴趋势和未来视角等。

关键观点8: 推广神经后门检测在各种架构中的一般性和挑战。

提出了一个黑盒神经后门检测方法ArcGen，旨在获取架构不变的模型特征用于有效的后门检测。通过减少架构信息对功能的影响并提高检测性能来解决挑战。

关键观点9: 保护联合学习中抵御极端模型中毒攻击的对策。

介绍了FLANDERS，一种用于抵御大规模模型中毒攻击的预聚合过滤器。通过将客户端更新视为时间序列中的离群值来识别恶意客户端更新。

关键观点10: 通过子图学习嵌入安全警报来消除警报疲劳的方法。

Alert2vec通过子图学习嵌入安全警报来解决警报疲劳问题。通过构建异构警报智能图并使用子图学习方法来生成警报向量，这些向量可以揭示警报的威胁级别。

关键观点11: 神经网络水印中蒸馏攻击的有效性及对策。

研究了蒸馏攻击对神经网络水印的有效性并提出了对策。通过设计内链方法来增强水印对蒸馏攻击的抵抗力。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
文章地址：访问文章快照

分享到微博

人工智能伦理、 安全与治理-论文12篇（2025年9月）