|
|
215-A1|多模态视觉生成,统一自回归理解与生成;自回归文生图;组件可控个性化,空间感知物体插入;... AIGC Research · 公众号 · · 1 年前 · |
|
|
215-B2|连接3DGS与深度估计,内存高效4D高斯,动态场景渲染;3DGS光滑物体逆渲染;XR相... AIGC Research · 公众号 · · 1 年前 · |
|
|
215-A3|基于多平面重建模型的高效分层3D生成,视图一致3D高斯重建,潜在3D高斯扩散用于场景合... AIGC Research · 公众号 · · 1 年前 · |
|
|
214-A1.2|扩散蒸馏、单步,自回归,数据合成;防止重新学习遗忘概念,在文本嵌入空间中过滤有害内... AIGC Research · 公众号 · · 1 年前 · |
|
|
215-B1|检索增强个性化助手,网页文本丰富视觉理解,中国图像隐喻理解,视觉上下文表示;通用AI生... AIGC Research · 公众号 · · 1 年前 · |
|
|
214-B|可变形神经网络;艺术品视觉定位;视频语言表示;长序列LRM,基于网格的逆渲染,重力信息提... AIGC Research · 公众号 · · 1 年前 · |
|
|
213-B1|“概念-属性-描述”结构的属性树提示学习;混合头注意力;具体与抽象概念的视觉属性;角色... AIGC Research · 公众号 · · 1 年前 · |
|
|
213-A1.2|面向真实世界实体图像生成的知识密集型评估基准,高效扩散模型从原理到实践的综述,特征... AIGC Research · 公众号 · · 1 年前 · |
|
|
213-B2|多视角场景图;GS重打光,稀疏/少样本NVS系列;文化遗产三维重建扩散修复;从RGB视... AIGC Research · 公众号 · · 1 年前 · |
|
|
213-A1.1|条件图像生成系列,文生图长文本对齐;图像编辑(基于场景图结合LLM,基于源图像的个... AIGC Research · 公众号 · · 1 年前 · |
|
|
212-A1.3|扩散推理/训练加速系列;无引导自回归生成;面向AIGC可扩展文件格式,视觉显著性引... AIGC Research · 公众号 · · 1 年前 · |
|
|
212-B2|照片修复,生成数据对分类任务模型偏差的影响;视觉二维曼巴,图像自回归建模;时间理解基准... AIGC Research · 公众号 · · 1 年前 · |
|
|
212-A1.1|混合自回归、集合自回归;线性DiT,深度压缩AE;高效可控生成,示例引导图像转译;... AIGC Research · 公众号 · · 1 年前 · |
|
|
212-A3|多视图生成,LRM可控3D生成,4D纹理生成,单图生3D;形状生成与参数化;高斯4D风... AIGC Research · 公众号 · · 1 年前 · |
|
|
212-A2|视频深度估计,角色图像动画化;相机运动控制,多对象轨迹控制;说话人重演,长视频数据集;... AIGC Research · 公众号 · · 1 年前 · |
|
|
212-B3|4D语言嵌入GS,高效隐式神经表征,可微弹性模拟,精确神经渲染;音频-文本引导全身手势... AIGC Research · 公众号 · · 1 年前 · |
|
|
212-A1.2|图像反演与编辑,文本引导编辑;定制化过拟合问题,语义水平概念擦除;图像物体抹除;视... AIGC Research · 公众号 · · 1 年前 · |
|
|
212-B1|多智能体模拟科学团队协作,决策逻辑与人类认知对齐,多模态评估基准,多模态自回归建模,长... AIGC Research · 公众号 · · 1 年前 · |
|
|
211-B1|声呐图像合成;百川Omni MLLM技术报告,音频描述生成|Mon AIGC Research · 公众号 · · 1 年前 · |
|
|
211-A1|掩码生成式“变换器”用于高分辨文生图,GPT评估平面设计,扩散视觉先验,全身匿名化隐私... AIGC Research · 公众号 · · 1 年前 · |