房屋设计耗时耗力耗钱?图约束的生成对抗网络帮你解决

在房屋设计耗时耗力的大环境下,如何才能使得建筑和房地产行业有效的降低建筑和房地产行业的设计成本?本文介绍了一种房屋平面设计自动生成方式,旨在不久的未来,能够在给定真实建筑约束下,生成 CAD 级别的房屋几何布局,从而帮助建筑师进行房屋设计。

图约束生成对抗网络

房屋对大多数人来说是一个重要的选项,多数人都倾向于舒适安全的环境。同时,在合理预算范围内尽量满足所有功能层面的需求是非常具有挑战性的。在此情况下,只有小部分的业主有足够的预算去聘请专业的建筑师进行房屋设计。

而另一方面,房屋设计是一个昂贵且耗时的迭代过程,在有限的时间和预算成本下,建筑师和客户很多时候只能在户型的设计质量上妥协。

总的来说,建筑户型设计是一件十分耗费时间成本的工作。一个标准的设计流程是:

  1. 起草一个「气泡图」(bubble diagram) 来显示房屋的房间数量,类型以及房间之间的连接关系;

  2. 绘制对应的房屋平面图并获取用户的意见反馈;

  3. 修改气泡图;

  4. 反复迭代上述过程。

所以,如果房屋平面设计图可以自动化生成,则可以有效的缓解这一系列难题,同时在房产、建筑、室内设计等相关行业也具有非常可观的发展前景。

而此次介绍的研究所提出的 House-GAN 模型在一定程度上解决了这一问题。 

本文研究的是一种全新的房屋布局自动生成问题,以气泡图作为输入,并生成各种与现实匹配的房屋布局图。气泡图由具体的图形表示,其中:

  1. 使用节点对房间类型进行编码;

  2. 使用其边缘对相邻空间进行编码。

而房屋的布局则表示为一组轴向对齐的房间边界框(可参考图 2)。

图 2:使用 House-GAN 进行平面布置图的设计,系统的输入是一个气泡图,它已编码了高级结构体系的约束。House-GAN 学会在气泡图约束下生成一系列逼真的房屋布局,同时建筑师再将布局图转换为真实的平面图。

简而言之,此项研究提出了一种新的图约束生成对抗网络,其生成器和鉴别器建立在一套关系架构之上。主要思路是将编码约束至其关系网络的图结构中。目前团队已经演示了面向新房屋布局生成方向的架构,其核心目的是将房屋架构约束为图形(例如具有空间邻接关系的房间数量和类型)并生成一组轴之间对齐的房屋边界框。

团队使用了三个指标来衡量生成的房屋布局的质量:真实性,多样性和与输入图约束的兼容性。同时对 117,000 张真实平面图像进行了定性以及定量评估,结果表明研究所提出的方法优于现有方法和标准。

效果是什么样的?

如上图所示,研究团队数据集采样中的气泡图以及房屋布局图。

多样性的评估:从同一气泡图生成的房屋布局作为示例。House-GAN 显示了种类最多的多样性变化。

兼容性的评估:研究团队固定了噪声矢量,并将房间的节点及其关联边缘进行依次添加。(多样性及兼容性的对比在第三部分有说明,详细信息可参考原文。)

什么是 House-GAN?

House-GAN 本质上是一个关系生成对抗网络。其核心是团队所提出的关系生成器和鉴别器,其中输入的图约束会被编码至关系网络的图结构中。值得注意的是,团队采用了 Conv-MPN,与 GCN 的不同之处在于,在设计空间中节点存储了特征量并且用卷积更新特征。

房屋关系布局生成器(顶部)和鉴别器(底部),其中 ConvMPN 是核心架构。

生成器获取每个房间的噪声矢量和气泡图,之后以每个房间轴对齐的形式生成房屋布局图。气泡图以图像形式表示,其中节点表示房间类型,而边缘表示空间邻接。更进一步讲,每个房间会生成一个矩形,并且两个具有边缘的房间必须在空间层面相邻(例如曼哈顿的距离应小于 8 像素)。 

输入图:给定一个气泡图形成 Conv-MPN,其关系结构图与气泡图相同。研究者为每个房间生成一个节点,并使用从正态分布中采样的 128-d 噪声向量进行初始化,并与 10-d 房间类型向量-→tr(独热编码)进行连接。r 是房间的索引。结果是 138-d 向量−→gr:

Conv-MPN 将特征作为 3D 张量存储在输出的设计空间中。研究员应用共享的线性层将-→gr 扩展为(8×8×16)特征量 g l = 1 r。(l = 1)表示该特征适用于第一个 Conv-MPN 模块,而该模块将被采样两次,以便在随后的 g l = 3 r 中变为(32×32×16)特征量。 

Conv-MPN /上采样:Conv-MPN 模块通过卷积消息的传递从而更新房间智能特征量图 [26]。更精确地讲,团队通过以下方式更新 g l r:1)图中连接的各个房间之间有一个汇总池特征;2)在未连接的房间之间会连接汇总池的功能;3)应用 CNN:

N(r)和 N(r)分别表示已连接和未连接的房间集。团队使用转置卷积(内核= 4,步幅= 2,填充= 1)将特征上采样扩充至 2 倍,同时保持通道数。生成器上具有两轮 Conv-MPN 和上采样,使得最终特征量为 g l = 3 r 的大小(32×32×16)。 

输出布局:共享的三层 CNN 将特征量转换为大小为(32×32×1)的房间分割蒙版。分割蒙版的图形将在训练期间传递给鉴别器。在测试时,房间蒙版(tanh 函数的输出范围为 [-1,1])而阈值设置为 0.0,团队为每个房间拟合了最紧密的轴对齐矩形从而生成房屋布局。

实验结果

从现实实用性角度来看,团队对 12 名研究生和 10 种专业建筑师进行了调研。每一个受访者都对比了以五种不同的方式从真实生活中所采样的 6 种类型的布局图,同时将这 6 种类型进行两两对比,形成 15 种对比组合,共计 75 次对比。

表 3 显示 House-GAN 拥有了最高的总用户评分。

图 5 显示了成对的比较结果。

对于每对方法,团队将两种维度的得分进行了比较,计算它们的平均得分,并取其差值。如果受访者总是对一种方法选择「更好」,则差异为 2.0。从另一方面说,如果差异分为 1.0(例如,学生对 GCN 的评分为 12),则表示该方法的一半被评为「better」,一半被评为「equally X」。

事实表明,不管是学生还是建筑师都将 House-GAN 评为除 ground truth 外最为现实的选择。

图 6 也同样定性地支持了相同的结论,House-GAN 效果最优。

不仅如此,除了在现实生活中的实用性之外,团队还根据不同的环境对模型的「多样性」「兼容性」进行了多维度的评估,效果非常不错,感兴趣的朋友可以参考论文原文。