专栏名称: AI新文
AI顶刊顶会新论文一号通,每天推送,助您时刻站在AI研究最前沿。包括:人工智能基础、交叉应用、脑认知与类脑智能、机器学习、模式识别与计算机视觉、自然语言处理、知识工程与数据挖掘、跨媒体与人机交互、智能机器人与系统、智能芯片与计算等。
TodayRss-海外RSS稳定源
目录
今天看啥  ›  专栏  ›  AI新文

人工智能伦理、 安全与治理-论文12篇(2025年9月)

AI新文  · 公众号  ·  · 2025-09-18 07:00
    

主要观点总结

本文主要介绍了多个关于人工智能、安全、机器学习领域的文章,包括模型的安全性问题、深度学习模型的异常检测、神经后门检测、安全警报处理等的最新研究进展。

关键观点总结

关键观点1: 乱序推送保护新文的策略和基于Deeplfash等技术处理机制。

微信公众号开始试行乱序推送,为及时获取AI新文,需将特定公众号设为星标。最新的技术处理机制如基于Deeplfash等的策略也在被研究和应用。

关键观点2: 保护修剪模型的分散联合蒸馏的优势和Ring Distill技术的特点。

Ring Distill是一种新型的DFD算法,专为跨竖井联邦环境设计,解决了现有DFD算法的局限性,包括自动模型修剪机制以进一步提高隐私保护和减少通信开销。

关键观点3: 差分隐私中的公平感知客户选择和支付确定的挑战和解决方案。

在差分隐私的联邦学习中,客户的数据隐私态度由他们的隐私预算量化。为确保公平,需考虑客户的异构隐私预算并联合选择参与者。新的拍卖机制实现了包括个体合理性、预算平衡等在内的期望属性。

关键观点4: 增强用户撤销的云数据共享系统的灵活性。

为了提高撤销用户访问特定密文或其他用户密钥时的效率,引入边缘服务器辅助的密钥刺穿技术和密钥拆分技术。

关键观点5: 多认证的单一证明在Web3环境中的应用和优势。

基于fNIZK的去中心化匿名功能证书(DAFC)方案允许用户为不同访问策略下的服务生成单个证明。DAFC的可链接性有效减轻了凭证滥用风险。

关键观点6: FLUTE的安全两方计算框架在大型语言模型中的应用和优势。

FLUTE是首个基于FSS的部分Transformer加密的LLM 2PC推理框架。它通过优化通信和矩阵乘法协议来增强安全性,在大型语言模型中的实验结果表明其显著优于当前技术。

关键观点7: 深度伪造检测的全面调查和未来展望。

对深度伪造检测进行了全面的调查和分析,包括驱动DeepFake扩散的关键因素、检测方法、新兴趋势和未来视角等。

关键观点8: 推广神经后门检测在各种架构中的一般性和挑战。

提出了一个黑盒神经后门检测方法ArcGen,旨在获取架构不变的模型特征用于有效的后门检测。通过减少架构信息对功能的影响并提高检测性能来解决挑战。

关键观点9: 保护联合学习中抵御极端模型中毒攻击的对策。

介绍了FLANDERS,一种用于抵御大规模模型中毒攻击的预聚合过滤器。通过将客户端更新视为时间序列中的离群值来识别恶意客户端更新。

关键观点10: 通过子图学习嵌入安全警报来消除警报疲劳的方法。

Alert2vec通过子图学习嵌入安全警报来解决警报疲劳问题。通过构建异构警报智能图并使用子图学习方法来生成警报向量,这些向量可以揭示警报的威胁级别。

关键观点11: 神经网络水印中蒸馏攻击的有效性及对策。

研究了蒸馏攻击对神经网络水印的有效性并提出了对策。通过设计内链方法来增强水印对蒸馏攻击的抵抗力。


免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
文章地址: 访问文章快照