专栏名称: PaperWeekly
PaperWeekly是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台,致力于让国内外优秀科研工作得到更为广泛的传播和认可。社区:http://paperweek.ly | 微博:@PaperWeekly
TodayRss-海外RSS稳定源
目录
今天看啥  ›  专栏  ›  PaperWeekly

WSDM 2025 | 从谱视角揭开推荐系统流行度偏差放大之谜

PaperWeekly  · 公众号  · 科研  · 2024-11-26 12:31
    

主要观点总结

本文揭示了推荐系统流行度偏差放大的原因,并提出了一种基于正则项的方法ReSN来纠正这个问题。研究发现推荐模型的评分矩阵的最大奇异向量与物品的流行度向量高度相似,维度缩减现象加剧了流行度偏差的放大效应。为了解决这一问题,提出了ReSN方法,通过正则化谱范数来抑制流行度偏差。

关键观点总结

关键观点1: 推荐系统流行度偏差问题

推荐系统基于用户历史行为数据进行个性化推荐,但往往“偏爱”热门内容,导致冷门物品难以被推荐。在Douban数据集中,热门物品在推荐列表中的比例过高。

关键观点2: 推荐模型评分矩阵的特性

推荐模型的评分矩阵的最大奇异向量与物品的流行度向量高度相似,最大奇异向量几乎完全捕获了物品的流行度特性。实验发现多个推荐模型的评分矩阵与物品流行度向量的余弦相似度超过98%。

关键观点3: 维度缩减对流行度偏差的影响

维度缩减现象加剧了流行度偏差的放大效应。一方面,推荐模型中用户和物品Embedding的低维设定会放大评分矩阵中最大奇异值的相对重要性;另一方面,优化过程中最大奇异值增长优先且迅速,导致模型更多依赖最大奇异特征,从而增强热门物品在推荐列表中的比例。

关键观点4: ReSN方法的提出与实现

为了解决流行度偏差问题,提出了ReSN方法,通过正则化谱范数(主奇异值)来抑制流行度偏差。然而,在实际计算过程中面临着计算资源和时间成本高的挑战。因此,通过简化谱范数计算和挖掘矩阵的低秩特性来提高计算效率。

关键观点5: 实验验证与亮点

在七个真实数据集上的实验验证中,ReSN方法全面优于其他方法。主性能实验显示ReSN在推荐整体准确性和纠偏性方面都表现突出。帕累托曲线深入探究了准确性-公平性之间的权衡。


免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址: 访问原文地址 (快捷配置)
总结与预览地址:访问文章预览/总结
文章地址: 访问文章快照