|
211-B2|网格表示+3DGS,高斯NVS,结合常识、视觉与触觉的稀疏重建;数字人手;推断物体内在... AIGC Research · 公众号 · · 9 月前 · |
|
211-A2|大型高质量视频数据集;语义分数蒸馏采样用于组合性文生3D,布局引导室内场景生成,3D ... AIGC Research · 公众号 · · 9 月前 · |
|
210-A1.2|DiT的Scaling Laws;扩散(精确反演编辑,蒸馏,离散);Rectifi... AIGC Research · 公众号 · · 10 月前 · |
|
210-B2|具身表征学习,3D视觉语言GS;GS系列(漏洞、效率等);室内重建,服装人类;运动系列... AIGC Research · 公众号 · · 10 月前 · |
|
210-A2.1|视频生成(利用文生图模型,渐进式自回归,基于离散扩散);高分辨音频驱动肖像动画化,... AIGC Research · 公众号 · · 10 月前 · |
|
210-A1.1|自回归、整流“变换器”;主体个性化,基于文本的编辑,少样本图像生成;改善平面设计,... AIGC Research · 公众号 · · 10 月前 · |
|
209-B1 B2|LVM;长PDF,音频、视频描述,视频LLM;StyleGAN,编辑,内容偏移,... AIGC Research · 公众号 · · 10 月前 · |
|
210-B1|GUI智能体,LLM数学推理;多模态视觉语言系列;文档RAG,视频摘要;基于感兴趣区域... AIGC Research · 公众号 · · 10 月前 · |
|
209-A补+B3|前沿模型空间认知能力,大型多种族人脸视频数据集,动态外观纹理;相机轨迹生成,XR... AIGC Research · 公众号 · · 10 月前 · |
|
209-A1.2|中文字体合成,图像像素艺术化,文生SVG;多样性与数据重现问题,优化VQ-VAE训... AIGC Research · 公众号 · 科技自媒体 · 10 月前 · |
|
209-A3.1|高斯-网格混合表示的视频到4D,组合式文生4D交互,人-物交互生成;PBR纹理生成... AIGC Research · 公众号 · · 10 月前 · |
|
209-A1.1|长篇故事可视化;HR图像生成,公共资源训练文生图;迭代反馈组合多种模型优势互补,从... AIGC Research · 公众号 · 科技自媒体 · 10 月前 · |
|
209-A2.2|金字塔流匹配用于高效视频生成,评估视频生成物理常识基准;为长视频生成预告片,双向扩... AIGC Research · 公众号 · · 10 月前 · |
|
209-A1.3|DiT训练加速、推理加速;扩散模型偏好对齐、训练效率提高、离散数据生成;抵御扩散恶... AIGC Research · 公众号 · · 10 月前 · |
|
209-A3.2|生成式可重打光LRM,3D表示方法研究综述;多奖励RL人类偏好文生动作,语言运动预... AIGC Research · 公众号 · · 10 月前 · |
|
209-A2.1|多概念视频定制化,结合数据、奖励与指导以增强视频生成,分析时间注意力以提高一致性,... AIGC Research · 公众号 · · 10 月前 · |
|
Day 208|已顺延至Day 209|Wed AIGC Research · 公众号 · · 10 月前 · |
|
207-B1|GUI智能体,MLLM的输入输出一致性,大型视觉-语言模型视觉感知系列|Tue AIGC Research · 公众号 · · 10 月前 · |
|
论文简读|FakeShield:基于多模态大语言模型的可解释图像篡改检测定位|北京大学 AIGC Research · 公众号 · · 10 月前 · |