一句话总结
CasLayout 受专业室内设计师工作流程启发,将家具布局生成分解为四个级联的条件扩散过程——家具类型、属性、关系隐空间、边界框位置——并引入隐式稀疏关系建模来减少冗余约束,实现了可控且高质量的室内场景合成。
背景与前置知识
▼级联生成:将复杂生成任务分解为按顺序执行的子任务,前一个输出作为后一个的输入条件。降低每个子任务的难度。
有向包围盒(OBB):带朝向的 3D 矩形框,描述物体的位置、尺寸和旋转。
场景图:节点代表物体、边代表空间关系的结构化表示。
图稀疏化:只保留有意义的关系(如功能区内关系),去掉无明确设计逻辑的边。减少计算量和冗余约束。
变分自编码器(VAE):学习数据潜在表示的神经网络。本文将关系图编码为紧凑的节点对齐隐向量。
核心思想详解
▼核心洞察来自室内设计师的工作方式:设计师不会一次性决定所有东西。 他们先确定房间需要什么家具,然后确定尺寸和风格,再考虑空间关系,最后精确摆放。CasLayout 将这个流程形式化为四个级联扩散阶段。
另一创新是隐式稀疏关系建模:全连接图中大部分关系(如"床-台灯")没有明确设计意义,不仅浪费计算还引入噪声。CasLayout 按功能区分组构建稀疏图,用双向 VAE 将 N² 的图复杂度压缩为 N 级别隐向量。
级联分解的优势:降低问题复杂度、减少数据需求、任意阶段可人为干预。