CasLayout: Cascaded 3D Layout Diffusion for Indoor Scene Synthesis with Implicit Relation Modeling

Yingrui Wu, You-Kang Kong, Mingyang Zhao, Weize Quan, Dong-Ming Yan, Yang Liu 2026-04-30
3D scene generation cascaded diffusion layout generation SIGGRAPH 2026 implicit relation modeling

一句话总结

CasLayout 受专业室内设计师工作流程启发,将家具布局生成分解为四个级联的条件扩散过程——家具类型、属性、关系隐空间、边界框位置——并引入隐式稀疏关系建模来减少冗余约束,实现了可控且高质量的室内场景合成。

背景与前置知识

级联生成:将复杂生成任务分解为按顺序执行的子任务,前一个输出作为后一个的输入条件。降低每个子任务的难度。

有向包围盒(OBB):带朝向的 3D 矩形框,描述物体的位置、尺寸和旋转。

场景图:节点代表物体、边代表空间关系的结构化表示。

图稀疏化:只保留有意义的关系(如功能区内关系),去掉无明确设计逻辑的边。减少计算量和冗余约束。

变分自编码器(VAE):学习数据潜在表示的神经网络。本文将关系图编码为紧凑的节点对齐隐向量。

核心思想详解

核心洞察来自室内设计师的工作方式:设计师不会一次性决定所有东西。 他们先确定房间需要什么家具,然后确定尺寸和风格,再考虑空间关系,最后精确摆放。CasLayout 将这个流程形式化为四个级联扩散阶段。

另一创新是隐式稀疏关系建模:全连接图中大部分关系(如"床-台灯")没有明确设计意义,不仅浪费计算还引入噪声。CasLayout 按功能区分组构建稀疏图,用双向 VAE 将 N² 的图复杂度压缩为 N 级别隐向量。

级联分解的优势:降低问题复杂度、减少数据需求、任意阶段可人为干预。

方法逐步拆解

关键公式/算法解读

实验设计分析

关键图表

局限性