|
207-B2|频域中加速网络推理,UNet数学解释,SAM变体综述;视觉皮层语义选择性,脑启发正则化... AIGC Research · 公众号 · · 10 月前 · |
|
207-B3|LLM三维情境理解,基于多视图可微渲染的单目深度图精细化|Tue AIGC Research · 公众号 · · 10 月前 · |
|
207-A1.2|RLHF系列(半策略偏好优化,在线反馈微调),解耦图像生成内部层中区域原语特征组件... AIGC Research · 公众号 · · 10 月前 · |
|
207-A2.2|语言驱动视频着色,共语手势视频生成,视频生成质量评估指标,视频摘要综述|Tue AIGC Research · 公众号 · · 10 月前 · |
|
207-A1.1|结合LoRA与CFG引导,视觉文本生成;可控自回归视觉生成,语义掩码可控图像生成,... AIGC Research · 公众号 · · 10 月前 · |
|
207-A2.1|结合自回归与扩散的长序列生成;类Sora模型的初步探索;提高视频生成质量(利用视频... AIGC Research · 公众号 · · 10 月前 · |
|
207-A1.3|肖像矢量素描化,通过多轮优化实现场景照片草图化;多模态控制自然书法生成,视觉艺术作... AIGC Research · 公众号 · · 10 月前 · |
|
207-A3.1|文本引导3D人脸编辑,可控3D虚拟试衣;统一文本、音乐与运动生成,基于扩散的自回归... AIGC Research · 公众号 · · 10 月前 · |
|
207-A1.4|多模态引导现实世界人脸修复,虚拟试衣伪影问题的条件修复;调查文生图模型中的概念关联... AIGC Research · 公众号 · · 10 月前 · |
|
207-A3.2|6DGS增强方向感知GS,NeRF物体变形与操控;可控形状建模;扩散模型应用于三维... AIGC Research · 公众号 · · 10 月前 · |
|
206-A1.2|生成式边缘检测器,脑电信号生成图像,评估文生图模型创建易读图文的能力|Mon AIGC Research · 公众号 · · 10 月前 · |
|
206-A1.1|整合基于文本与拖拽的编辑,PSO微调时间步长蒸馏扩散,个性化训练数据泄露与版权;加... AIGC Research · 公众号 · · 10 月前 · |
|
206-B|弥合文本、音频、图像及任何序列之间的gap,视频LLM;扩散模型用于判别任务,离散扩散用... AIGC Research · 公众号 · · 10 月前 · |
|
206-A2|电影剧本可视化,视频详细字幕生成,视频生成中时间依赖性建模;基于文本或视频的多模态音频... AIGC Research · 公众号 · · 10 月前 · |
|
206-A3|单图生CAD;变分贝叶斯GS用于连续数据流;指令引导角色场景交互合成,大运动模型与数据... AIGC Research · 公众号 · · 10 月前 · |
|
186-A1|自回归视觉生成(开源民主,整合视觉理解与生成,高效DiT用于文生X,手写文本生成;复杂... AIGC Research · 公众号 · · 11 月前 · |
|
186-B1|多模态图表形式几何问题求解,多模态文本生成的幻觉问题;多视角驾驶场景视频生成;运动想象... AIGC Research · 公众号 · 科技创业 科技自媒体 · 11 月前 · |
|
186-B2|单图重建3D高斯人,多视角图像编码与压缩,室内3D物体检测;体型条件自然合理人类运动生... AIGC Research · 公众号 · · 11 月前 · |
|
185-A2|视觉屏幕内容的水印保护;文本驱动视频编辑;几何图像表面表示的文生3D,基于大型视觉模型... AIGC Research · 公众号 · · 11 月前 · |
|
185-B1|大型VLM掌握了艺术史吗?基于MoE架构的图表理解,MLLM从图像到视频理解;音频驱动... AIGC Research · 公众号 · · 11 月前 · |