针对户型图数据集的调研
最近要做一个多媒体领域的方向综合设计,题目是基于扩散模型的户型图数据增强系统设计与实现,所以目前对现有的数据集进行调研。
之前的博客有对最基本的DDPM的详细说明,包括数学原理、公式推导、代码详解,现在我们将目光聚焦到数据集,一个标准的扩散模型需要什么样的数据集呢?很显然,如果你只是想做 Img-to-Img,那你的数据集就是单纯的img就好了,不需要额外的标注;如果你想做Text-to-Image,那么你就需要文本和图像成对的数据集进行训练,其他的多模态也同理。
ok,我们现在已经确定需要的是纯图片数据集,其实我们知道,像户型图这种小众的数据集,纯图的还是比较难找的,我们可以找一些之前做户型图任务的相关工作,看看他们用的是什么数据集,如果是纯图的,那最好,如果不是,那我们就想办法把它变成纯图的。当然,也要做好最坏的打算,如果真的很难找到,那就写个爬虫,从一些售房的网站上爬取一些户型图下来。
之前关于户型图的工作
HouseDiffusion(CVPR 2023 SFU)
HouseDiffusion: Vector Floorplan Generation via a Diffusion Model with Discrete and Continuous Denoising,22年完成,今年中稿CVPR的一篇工作,先不用管这篇工作的核心贡献是什么,我们只需要关注他用了什么数据集训练?用什么数据集评估?
ok,找到了:
作者用了 RPLAN ,并且在此基础上提出了一个 Non-ManhattanRPLAN (在RPLAN基础上,在外墙随机添加两个角)
通过后面的Experiment可以看出来,基本都是围绕RPLAN这个数据集进行测试的。那我们标记一下RPLAN这个数据集,再看看别的。
Diffusion Models for Computational Design at the Example of Floor Plans
Diffusion Models for Computational Design at the Example of Floor Plans,这个是今年7月的一篇比较新的工作,我们还是只关注数据集,具体这篇工作的创新点,有空再看。
ok,虽然这篇工作中并没有提到他具体用了什么数据集,但是通过读论文后我们可以知道,Nbimer(毕马汇)提供了一个5000+的CAD户型图数据集,ok,我们也标注一下这个数据集。
Residential floor plan recognition and reconstruction
Residential floor plan recognition and reconstruction收录于CVPR 2019,由阿里巴巴的团队提出。
这篇文章提出的数据集是居住房屋平面图数据集(RFP)。研究者从互联网搜索引擎中爬取了7000个居住房屋平面图数据,这些数据主要是中国城市建筑的家庭平面图。研究者通过手动标注来标记墙壁的起始端点、终止端点和厚度。每个墙壁的每个部分都用一条带有宽度的线表示。他们还标注了门、窗户和门口的起始点、终止点和厚度。门、窗户和门口都位于特定的墙壁上。每个房间由多个墙壁的部分环绕,研究者也手动标注了房间类型,包括客厅、卧室、浴室、阳台、厨房、图书馆和其他类型的房间。研究者使用栅格化将当前标注转换为逐像素的注释,其中每个像素表示一种类型。
很可惜的是,作者并没有提供数据集的下载链接,只是提供了爬取数据的网址,我想可能是因为版权费用的原因吧。
CubiCasa5K: A Dataset and an Improved Multi-task Model for Floorplan Image Analysis
CubiCasa5K: A Dataset and an Improved Multi-task Model for Floorplan Image Analysis这篇论文由cubicasa公司在2019年发表,比较可惜的是,截止到目前我并没有查询到这篇论文中稿的信息,不过比较好的是cubicasa公司开源了该数据集,这个数据集看起来也很不错,可以重点标记一下。
数据集汇总
RPLAN
这个数据集在户型图的相关工作中出现的次数可谓太多了,我们重点看一下这个数据集。
RPLAN数据集来源自论文:Data-driven Interior Plan Generation for Residential Buildings SIGGRAPH 2019 USTC
平面图数据集的英文是Floor Plan Dataset,我觉得作者给这个数据集命名时应该是提取了其中的RPLAN四个字母。
我仔细一看才发现,这篇论文的一作就是我这个综合设计的指导老师吴文明老师,这篇论文是SIGGRAPH(图形学顶中顶中顶刊,国内能发这个刊的组凤毛麟角),我们就来详细看看这个数据集。
作者从亚洲房地产市场的真实住宅楼中收集了超过12万份平面图。每个平面图在18m×18m的正方形区域内都有一个矢量图形表示,包括几何和语义信息。为了应用学习方案,作者将每个平面图转换为256×256的图像。
我们来看下这个数据集吧
看起来和论文里的效果还是有区别的,具体的问题我再探究一下。
Nbimer
这个数据集纯纯耍流氓,不仅得一个一个下,一天的免费下载额度只有3次,纯纯恰烂钱,直接pass掉。
CubiCasa5K
这个数据集大概5.5G,其中每张数据的质量还是很高的:
不过比较可惜的是数据的一致性并不高,将其作为扩散模型的原料,效果不一定好,而且其中出现的标注,对于diffusion model的生成来说可能还是要求过高了,具体效果我还需要试一试。
InteriorNet
该数据由论文 InteriorNet: Mega-scale Multi-sensor Photo-realistic Indoor Scenes Dataset 提出,由Imperial College London提出。

这个数据集主要是3D的数据,不太适合此次的任务,所以先pass掉。
构建自己的数据集
爬取一些网站的户型图数据
直接用其他研究工作者的数据集有点不好意思,我寻思还是自己爬取一些数据,插在里面,填补一下我小小的自尊心
爬虫代码如下:
1 | ##正式版 |
结果如下:

最终数据集
目前我都想法是使用两个版本的数据集:
- 第一个版本用:RPLAN
- 第二个版本用:CubiCasa5K + 自己爬取的数据集
具体最后验收时用那个,还得看具体训练出来的效果而定。
- 本文作者: 李宝璐
- 本文链接: https://libaolu312.github.io/2023/11/18/针对户型图数据集的调研/
- 版权声明: 本博客所有文章除特别声明外,均采用 MIT 许可协议。转载请注明出处!
Related Issues not found
Please contact @libaolu312 to initialize the comment