京东零售广告创意：统一的布局生成和评估模型

京东科技技术说 · 公众号 · 程序员 · 2026-01-15 09:59

主要观点总结

该论文介绍了MM2025的Uni-Layout项目，该项目旨在解决布局生成和评估中的一些问题。它整合了人类反馈，提出了一个统一的布局生成和评估系统。论文从背景及现状、如何实现跨任务的统一布局生成、如何模拟人类来评估布局、如何有效对齐人类反馈和布局生成以及实验结果等五个方面进行了详细介绍。

Uni-Layout项目旨在解决布局生成中的任务特定性和评估标准与人类感知不一致的问题。它通过构建一个统一的生成器、模拟人类的评估器以及二者之间的对齐机制，来提高布局生成的质量和效果。

为了系统地统一当前分散的布局生成任务领域，Uni-Layout提出了一个基于两个维度的精心组织的分类法，并结合多模态大型语言模型（MLLMs）提出了一个统一的布局生成器。

为了弥补人类感知在布局设计中的重要性而现有数据集中缺乏人类反馈的缺口，Uni-Layout汇总了统一生成器的输出，并编制了Layout-HF100k数据集。基于这一数据集，它开发了一种评估器，该评估器能够模拟人类的判断模式，并提供与人类感知模式紧密对齐的可解释评估。

现有的对齐方法存在一些问题，如未能反映人类偏好的不同程度。为了解决这一问题，Uni-Layout提出了DMPO技术，该技术能够更好地捕捉人类判断的范围，从而实现与布局生成和人类偏好的更精确对齐。

论文的实验结果证明了Uni-Layout的有效性。与一些领先的闭源模型（如GPT-4o、Claude3.5等）和开源的多模态大语言模型（MLLMs）相比，Uni-Layout在布局评估和生成任务上的性能表现更加出色。

免责声明：本文内容摘要由平台算法生成，仅为信息导航参考，不代表原文立场或观点。原文内容版权归原作者所有，如您为原作者并希望删除该摘要或链接，请通过【版权申诉通道】联系我们处理。

原文地址：访问原文地址
总结与预览地址：访问总结与预览
文章地址：访问文章快照

分享到微博