【ETHZ博士论文】人工智能稳健性和公平性的形式化与统计认证

专知 · 公众号 · 科技媒体 · 2024-08-15 11:30

主要观点总结

本文探讨了人工智能安全的两个重要方面：稳健性和公平性。文章介绍了在保证机器学习模型稳健性和公平性的方法上取得的进展，包括通过优化和采样认证模型的稳健性，训练既具有高度稳健性又具有高标准精度的模型，学习可证明的公平表示等。这些方法具有广泛的应用潜力，对未来人工智能系统的安全性具有重要意义。

随着深度学习模型越来越多地与关键系统相结合，解决人工智能安全问题成为该领域的核心挑战之一。稳健性和公平性是其中的两个重要方面。

稳健性要求模型在输入分布与训练时遇到的分布不同的条件下也能表现良好。论文通过优化和采样方法认证模型的稳健性，并通过训练模型使其被证明是稳健的。

公平性是一种安全属性，要求模型的预测对不同个体和群体是公平的。论文开发了新的方法来学习可证明满足个体或群体公平性的公平表示，并将个体公平性与稳健性联系起来。

论文的主要目标是推进能够保证机器学习模型稳健性和公平性的方法。论文在四个章节中分别探讨了几何稳健性的认证、训练可被证明稳健的网络、可被证明的个体公平表示、可被证明的群体公平表示等贡献。

论文的技术和方法对机器学习模型的稳健性和公平性产生了重要影响，具有广泛的应用潜力。论文的工作也被更广泛地应用于认证空间、点云和音频变换的稳健性，训练具有更好认证稳健性和精度权衡的模型，以及学习可证明的公平表示等领域。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址 (快捷配置)
总结与预览地址：访问文章预览/总结
文章地址：访问文章快照

分享到微博