今天看啥  ›  专栏  ›  ai缝合大王

(CVPR 2025 Highlight)风格感知视觉状态空间模块SAVSSM,针对Mamba的条件...

ai缝合大王  · 公众号  · AI 科技媒体  · 2025-08-25 17:21
    

主要观点总结

论文介绍《SaMam: Style-aware State Space Model for Arbitrary Image Style Transfer》

关键观点总结

关键观点1: 论文提出一种基于Mamba架构的任意图像风格迁移骨干网络SaMam。

将Mamba架构与任意图像风格迁移任务结合,提出SaMam风格迁移模型,兼顾全局有效感受野和线性计算复杂度,为风格迁移任务提供新的骨干网络方案。

关键观点2: 介绍风格感知视觉状态空间模块(SAVSSM)及其核心组件。

提出风格感知Mamba解码器,主体结构是SAVSSM,包括风格感知结构化状态空间序列块(S7 Block)、风格感知实例归一化(SAIN)、风格感知卷积(SConv)和风格感知通道调制(SCM)。S7 Block通过从风格嵌入表示预测SSM中的权重参数,有效引入风格信息。

关键观点3: 介绍Z字形扫描机制和局部增强模块的作用。

引入Z字形选择性扫描方法,以空间连续的方式处理图像标记序列,提高语义连续性。针对SSM的局部像素遗忘问题,提出简单有效的局部增强模块。

关键观点4: 描述SaMam模型的工作流程和适用场景。

输入内容和风格图像经过编码器和风格感知Mamba解码器生成特征图。风格特征作为条件信息注入,引导内容特征的风格迁移。被风格化的特征由轻量级解码器重建,生成风格迁移图像。SaMam模型适用于图像复原、超分辨率任务、条件引导的图像/视频生成和低资源设备的高效建模等场景。

关键观点5: 提供SAVSSM模块的详细结构和代码实现。

SAVSSM模块作为即插即用模块,可以嵌入特征融合或条件注入任务中。其核心S7 Block通过自适应预测状态空间参数A和D,实现对状态空间更精细的控制。该模块使Mamba模型在全局建模的基础上,进一步实现条件引导的状态空间控制。


免责声明

免责声明:本文内容摘要由平台算法生成,仅为信息导航参考,不代表原文立场或观点。 原文内容版权归原作者所有,如您为原作者并希望删除该摘要或链接,请通过 【版权申诉通道】联系我们处理。

原文地址:访问原文地址
总结与预览地址:访问总结与预览
推荐产品:   推荐产品
文章地址: 访问文章快照