专栏名称: AI新文
AI顶刊顶会新论文一号通,每天推送,助您时刻站在AI研究最前沿。包括:人工智能基础、交叉应用、脑认知与类脑智能、机器学习、模式识别与计算机视觉、自然语言处理、知识工程与数据挖掘、跨媒体与人机交互、智能机器人与系统、智能芯片与计算等。
TodayRss-海外RSS稳定源
目录
今天看啥  ›  专栏  ›  AI新文

IEEE Transactions on Multimedia-2025年12月-最新在线出版论文1...

AI新文  · 公众号  ·  · 2025-12-05 07:00
    

主要观点总结

本文主要介绍了多个与图像处理和视觉相关的研究,包括隐私保护、多模态视觉编码、视频即时心率测量等。这些研究通过使用不同的技术和方法,解决了各种视觉任务中的挑战,提高了性能和准确性。

关键观点总结

关键观点1: ErableMask:一种针对黑盒人脸识别模型的稳健且可擦除的隐私保护方案

通过重新思考代理FR模型之间的内在关系,引入了一种新颖的元辅助攻击,增强了黑盒迁移性。还提供了一种扰动擦除机制,支持在受保护的面部中擦除语义扰动而不降低图像质量。

关键观点2: MCSF-Net:用于水下图像增强的多色彩空间融合网络

提出了用于水下图像增强的多颜色空间融合网络(MCSF-Net),融合了多维特征融合块和加权特征融合方案,有效整合了来自XYZ和RGB颜色空间的互补特征。

关键观点3: DFFL:不完整多视图多标签学习的双特征融合

提出了一种双特征融合学习(DFFL)框架,同时考虑视图特定的独特特征和跨视图的一致性特征,通过构建视图一致性学习,最大化共享嵌入空间中的互信息以实现一致的特征对齐。

关键观点4: TFNet:可信赖的连续手语识别

提出了可信融合网络(TFN),包括跨模态特征融合模块和跨线索可信融合模块,用于动态融合RGB和关键点信息的跨模态特征,获得鲁棒的视觉线索特征。

关键观点5: 基于增强的时间频率表示的视频即时心率测量

采用小波同步挤压变换生成时间频率表示图像,同步反映视频片段中的心率。此外,介绍了TransUNet来精炼这些TFR图像,增强与IHR相关的脊线信息。

关键观点6: 探索跨模态互促学习在视频质量评估中的应用

介绍了一种新颖的跨模态提示基于的方法,使用可学习的提示促进视觉和语言模式之间的协同作用。多视图骨干网络经过精心设计,确保了质量可分离性。

关键观点7: S2ML:空间-光谱互学习用于深度完成

提出了一种空间光谱互学习框架(S2ML),以调和空间域和频率域的优点用于深度完成。考虑了振幅谱和相位谱的不同特性,并设计了一个专用的频谱融合模块。

关键观点8:

提出了一种新的统一的语言引导框架——视觉-语言相互提示法(VLMP),利用文本提示来增强CSS。包括视觉到语言提示和语言到视觉提示,双向建模了视觉和语言特征之间的交互。

关键观点9:

设计了判别特征重组模块(DFR)和图结构精炼模块(GSR)来解决视觉图神经网络中的隐含依赖关系问题。

关键观点10:

确定了六种球形全景内容泄露场景,并考察了有效水印方法的要求。提出了两种补充方法来增强盲水印技术的性能。

关键观点11:

提出了一种融合增强网络,该网络有效地丰富了语义信息,并基于红外和可见光模态的互补特性整合了特征。所提出网络可以扩展到高级视觉任务,表现出强大的泛化能力。


免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
文章地址: 访问文章快照