本文内容来源于《测绘学报》2021年第6期(审图号GS(2021)3565号)
行瑞星, 武芳, 巩现勇, 杜佳威, 刘呈熠
信息工程大学地理空间信息学院, 河南 郑州 450001
基金项目:国家自然科学基金(41471386;41801396)
摘要:建筑群空间分布模式识别对制图综合、多尺度表达及空间数据挖掘具有重要意义。针对局部异质性明显的建筑群直线模式识别提取问题,本文提出基于模板匹配的建筑群组合直线模式识别方法。首先分析研究组合直线模式的认知特征和定义;然后,利用建筑物的空间邻近性、尺寸和方向约束进行聚类,获得建筑物间的空间邻近关系和扩展对齐关系;以放大的建筑物最小面积外接矩形作为初始匹配模板;最后,在确定模板分布间隔及方向的基础上,考虑组合直线模式的直线性、相似性和局部异质性约束条件,通过连续构建模板进行搜索匹配,识别出组合直线模式。试验表明本文方法能有效识别出组合直线模式,其识别结果符合人类认知特点。
关键词:制图综合 建筑群 视觉感知理论 模式识别 组合直线模式
空间分布模式是指所关注地理要素在空间分布形态上呈现出能够被识别且明确命名的形状或排列[1-2]。结合人类认知特征挖掘矢量地图数据中隐含的空间关系、结构和分布模式等知识,对于制图综合、时空数据挖掘等领域具有重要的理论意义和应用价值[1-5]。建筑群作为一类重要的地理要素,其隐含的空间分布特征,即本文的研究范畴,一直是制图综合领域研究的热点和难点[6-8]。
当前,建筑群空间分布模式的研究主要关注两个方面的问题[9]:一是模式的认知与定义,二是模式的识别和提取。建筑群空间分布模式定义是识别的前提和基础,在不同的研究领域,模式的定义则有不同的依据[10]。根据建筑物的功能结构,文献[11]提出工业/商业、市中心、市区、郊区和农村地区等5种模式。在制图综合领域,建筑群分布模式的分类和定义主要根据几何特征和空间分布特征,文献[12]将建筑群模式分为线型模式(直线型、曲线型和沿道路型等)和非线型模式(网格型和不规则型)。此外,有学者对建筑群字符型分布模式进行了研究[13-14]。建筑群分布模式识别提取的研究多集中于两个步骤[4, 15-17]:①基于空间邻近的聚类;②基于视觉感知理论的空间分布特征多参数约束的模式识别。文献[18]利用Delaunay三角网构建邻近图,通过对最小支撑树进行反复修剪,实现直线模式和曲线模式的识别;文献[19]结合结构化参数对邻近图进行异质性修剪,探测出多连通的直线模式,并通过图论算法识别提取出网格模式。此外,还有采用深度学习的方法提取建筑群空间分布特征,文献[20]利用图卷积深度学习的方法提取了典型线型分布特征。直线模式识别作为一种空间数据增强方法,能有效挖掘建筑群的分布特征,为后续地图综合提供重要支持。然而,现有建筑群直线模式研究多关注于以单个建筑物为单元的同质性建筑群直线模式,对于大比例尺中建筑群局部异质性明显但整体呈直线模式分布的现象则缺乏关注,当前尚未有学者对此问题进行深入研究。在识别建筑物分布模式时,不仅需要考虑同质性建筑群的直线分布模式,还需要考虑局部异质性明显建筑群的直线分布模式,从而可以获取更全面的建筑群空间分布模式。因此,为了解决具有局部异质性的建筑群直线模式识别问题,本文提出一种基于模板匹配的建筑群组合直线模式识别方法,主要解决两个问题:①分析建筑群组合直线模式局部异质性的特点,提出多层次认知下建筑群组合直线模式的认知特征和定义;②采用模板匹配的策略解决局部异质性导致识别困难的问题, 实现建筑群组合直线模式的提取。
1 建筑群组合直线模式的认知特征 建筑群的空间分布具有丰富的几何结构模式,其结构特征的识别是人类对空间信息进行感知、识别和推理的过程[21]。如何使计算机“理解”人类对建筑群模式的空间认知规律,是建筑群模式自动识别的关键。
图 1 整体到局部的感知认知 Fig. 1 The perception and cognition from whole to part |
2 基于模板匹配的组合直线模式识别 人作为认知主体自然地以有组织的模式感知空间场景遵循格式塔认知准则,主要包括:邻近性、相似性、连续性、封闭性、连通性和共同区域等6个原则[15-17]。对于建筑群,封闭性、连通性和共同区域可由邻近性代替,因此在建筑群模式识别时,主要考虑邻近性、相似性和连续性[19, 25]。考虑到组合直线模式的直线性、相似性和局部异质性等特点,结合人类视觉格式塔认知准则,从建筑物的形状、大小和方向建立认知意义上的结构化参数(表 1),作为组合直线模式提取的约束条件。
人作为认知主体自然地以有组织的模式感知空间场景遵循格式塔认知准则,主要包括:邻近性、相似性、连续性、封闭性、连通性和共同区域等6个原则[15-17]。对于建筑群,封闭性、连通性和共同区域可由邻近性代替,因此在建筑群模式识别时,主要考虑邻近性、相似性和连续性[19, 25]。考虑到组合直线模式的直线性、相似性和局部异质性等特点,结合人类视觉格式塔认知准则,从建筑物的形状、大小和方向建立认知意义上的结构化参数(表 1),作为组合直线模式提取的约束条件。
表 1 组合直线模式结构化参数 Tab. 1 Structural parameters for combined collinear pattern
参数 | 参数含义 | 计算方法 |
矩形度(Rec) | 描述建筑物的矩形化、直角化的程度 | 建筑物与其最小面积外接矩形面积的比值 |
长度比(RLen或RWid) | 描述建筑物SMBR轴线的长度差异 | 两个轴线中较短的长度除以较长的长度值 |
模板重合度(OLarea) | 描述建筑物与直线模式模板重合面积的差异 | 建筑物与模板重合区域面积与建筑物面积的比值 |
局部方向差异(LDorient) | 描述建筑物之间的方向差异 | 最小面积外接矩形的主方向之差 |
整体方向差异(ODorient) | 描述一个直线模式内建筑物的整体方向异质性 | 起始建筑物与其他建筑物质心连线方向的差值 |
本文采用“自顶向下”与“自底向上”相结合的策略进行组合直线模式的识别提取:首先基于建筑物邻近性、尺寸和方向约束进行聚类,获得建筑物空间邻近关系和扩展对齐关系;然后,构建建筑群直线模式的连续匹配模板,以所建的模式结构化参数为约束,最终实现组合直线模式的提取。
建筑物的空间邻近及扩展对齐关系构建作为直线模式识别提取的数据准备阶段,主要提供空间数据模型支撑。建筑物的空间邻近性是其构成直线模式的必要条件,邻近关系的构建是建筑群模式识别的首要任务。本文采用约束Delaunay三角网构建建筑物邻近关系,构网之前需要对建筑物边界进行内插加密。根据第1节分析可知,只有呈扩展对齐分布的建筑物才有可能形成组合直线模式,建筑物扩展对齐关系的确定是组合直线模式识别提取的前提。扩展对齐关系可在空间邻近关系的基础上获取,具体步骤如下:
图 2 扩展对齐分布聚类结果 Fig. 2 Clustering result of extension alignment |
本文构建匹配模板的思路是首先根据待识别的(组合)建筑物确定初始匹配模板的几何特征(形状、尺寸),然后根据初始匹配模板连续构建形状、尺寸相同且呈等间隔直线分布的模板来搜索、匹配待识别的建筑物。初始匹配模板的几何特征由待识别(组合)建筑物决定。由于组合直线模式中建筑物与模式构件有1∶1和n∶1的空间对应关系,因此,在构建初始匹配模板时需要考虑两种情况:①以单个建筑物为搜索起点构建匹配模板,如图 3(a)中建筑物A;②以组合建筑物为起点构建匹配模板,如图 3(b)中建筑物A和B组成的组合建筑物。考虑到组合直线模式的模式构件为形状规则、矩形度高的(组合)建筑物,因此本文以(组合)建筑物的SMBR作为匹配模板。模式识别过程中,根据匹配模板与建筑物的空间关系可以初步筛选出待识别的建筑物候选集合,为了适当扩大模板匹配范围,需要对提取的SMBR进行一定程度的放大,将放大后的SMBR作为初始匹配模板,如图 3(a)、(b)中虚线框所示。
图 3 初始匹配模板构建 Fig. 3 Construction of initial matching template |
根据初始匹配模板连续构建形状、尺寸相同且呈等间隔直线分布模板的关键是确定模板的分布间隔和方向,根据典型的建筑群直线模式分布特征可知,模式中任意两个直接邻近建筑物的分布间隔和方向(质心连线方向)可以反映整个直线模式内建筑物的分布特征。本文利用锚点来表达相邻建筑物的分布特征(间隔、方向),结合图 4所示,设图 4(a)中的矩形SA(A1A2A3A4)和SB(B1B2B3B4)是相邻建筑物A和B的SMBR,相邻建筑物锚点的获取步骤如下:
图 4 获取相邻建筑物锚点 Fig. 4 Obtaining anchor points of adjacent buildings |
分析可知,对于两个大小、形状相似且主方向一致的建筑物,以锚点为基准进行叠置则两个建筑物的重合面积与自身面积基本相等。结合典型直线模式认知特征可知,模式内两个相邻建筑物的任一组锚点间距可以表达模式内建筑物的分布间隔,而其连线的方向则表达了模式内建筑物的分布方向。因此,可以根据起始建筑物和相邻建筑物之间锚点计算出后续匹配模板的位置。如果相邻建筑物与其扩展对齐的建筑物能以组合的形式作为组合直线模式构件,虽然起始建筑物与该邻近建筑物之间的不同锚点表达不同分布特征的模板,如图 5(a)、(b)所示,但肯定存在一组可以表达该模式内建筑物空间分布特征的锚点。因此本文分别取该邻近建筑物SMBR任一对角线上的两个端点获取锚点,并以此分别构建后续的匹配模板,如图 5所示,顶点B1和B3是一条对角线的端点,分别以A1、B1和A3、B3组成锚点,可构建出不同分布特征的匹配模板。
图 5 根据不同锚点构建匹配模板 Fig. 5 Matching templates based on different anchor points |
结合图 5所示,后续匹配模板的构建步骤为:设矩形A′1A′2A′3A′4是已构建的初始匹配模板。以A1、B1为一组锚点为例,已知点A1、B1和A′1的坐标为(x1,y1),(x2,y2)和(x3,y3),则可通过式(2)量化表达匹配模板的分布特征,新模板的对应顶点B′1坐标(x4,y4)可由式(3)计算得知,同理可计算出其他顶点的坐标
(2)
(3)
根据新模板的顶点坐标和式(3)不断计算出后续模板的顶点坐标。
2.4 建筑群组合直线模式提取
(1) 根据2.1节方法获取建筑物间的空间邻近和扩展对齐关系。
(2) 选取任一建筑物或由k个建筑物组成的组合建筑物作为起始建筑物Ps(k=2, 3, …n;n代表空间数据中存在最多包含n个两两直接邻近且呈扩展对齐排列建筑物的组合建筑物),如果Rec(Ps)>δrec,则构建初始匹配模板,将Ps记录到模式链表Pattern,执行步骤(3);否则执行步骤(2),直到遍历完所有建筑物和组合建筑物,执行步骤(8)。
(3) 选取任一与Ps直接邻近的建筑物Pn,如果Rec(Pn)>δrec且LDorient(Ps, Pn) < δori,则执行步骤(4);否则,执行步骤(3),直到遍历完所有直接邻近建筑物,执行步骤(2)。
(4) 计算出Ps与Pn的两组锚点,根据锚点和起始匹配模板分别构建出新的模板Mnew,分别执行步骤(5)。
(5) 如果OLarea(Pn, Mnew) < δarea,则执行步骤(2);否则,判断Rlen(Ps, Pn)、Rwid(Ps, Pn),如果Rlen(Ps, Pn)>δlen且Rwid(Ps, Pn)>δwid,将Pn记录到直线模式链表Pattern中,执行步骤(7);如果Rlen(Ps, Pn) < δlen或Rwid(Ps, Pn) < δwid,则将Pn记录到数组PList,执行步骤(6)。
(6) 搜索与Pn扩展对齐的邻近建筑物Pe,如果不存在Pe则执行步骤(2);如果OLarea(Pe, Mnew) < δarea,则执行步骤(2);否则,将Pe记录到数组PList,计算数组PList内所有建筑物长轴之和、短轴均值分别与Ps的长轴、短轴的长度比Rlen、Rwid,如果Rlen < δlen或Rwid < δwid,则将建筑物Pe标记为Pn,执行步骤(6);否则,将数组PList内所有建筑物视为一个组合建筑物Pc,如果ODorient(Pc) < δori,则将PList记录到直线模式链表Pattern中,执行步骤(7);否则,则执行步骤(2)。
(7) 根据锚点和模板Mnew构建出新的模板并标记为Mnew,遍历Pattern中最后一个建筑物Pl直接邻近的建筑物并标记为Pn,如果Rec(Pn)>δrec且LDorient(Pl, Pn) < δori,则执行步骤(5);否则,执行步骤(2)。
(8) 删除所有不包含组合建筑物的模式,去除完全重复的模式。
图 6 组合直线模式识别过程 Fig. 6 Process of combined collinear pattern recognition |
3 试验与讨论 3.1 试验
图 7 组合直线模式识别试验结果 Fig. 7 Experiment result of combined collinear pattern recognition |
试验 | 扩展对齐聚类 | 模板匹配识别 | |||||||
短轴长度比阈值δwid | 方向差阈值δori | 矩形度阈值δrec | 放大倍数阈值δzoom | 长轴长度比阈值δlen | 短轴长度比阈值δwid | 模板重合度阈值δarea | 方向差阈值δori | ||
试验1 | 0.8 | 10° | 0.85 | 1.5 | 0.85 | 0.8 | 0.85 | 10° | |
试验2 | 0.75 | 6° | 0.85 | 1.3 | 0.85 | 0.75 | 0.85 | 10° |
试验数据2为中国广州市区的局部建筑群,数据来自OpenStreetMap,比例尺为1∶5000,试验区域总共包含288个建筑物,如图 8(a)所示。所选试验区域多数建筑物形状规则、矩形度高,建筑群整体分布密集,没有全局平稳的特征,一阶邻域内要素的面积变化较大,有明显的空间异质性,但在某些局部区域存在较为平稳的特征,因此在视知觉上呈现出明显的组合直线模式。参数设置如表 2,扩展对齐分布聚类如图 8(b)所示,识别提取的组合直线模式如图 8(c)所示,识别提取的简单直线模式如图 8(d)所示。图 7、图 8中虚线为每个组合建筑物内相邻建筑物几何中心的连线,用以表示由组合建筑物形成的模式构件,实线为每个直线模式内相邻模式构件即建筑物或组合建筑物的几何中心连线,用以表示由模式构件形成的直线模式。
图 8 组合直线模式识别试验结果 Fig. 8 Experiment result of combined collinear pattern recognition |
对试验1的结果进行统计、对比分析可知,本文方法提取出18个组合直线模式,对比试验提取出46个简单直线模式,本文提取的组合直线模式中有15个与对比试验结果中29个简单直线模式存在相交或者包含的关系。其中有23个简单直线模式分别包含于12个组合直线模式,例如,图 9(d)中的3个简单直线模式1、2、3分别作为模式构件完全包含于图 9(a)中的组合直线模式1。其余6个简单直线模式与9个组合直线模式存在相交的关系,例如,图 9(e)中简单直线模式1内有3个建筑物分别与其他建筑物组合成模式构件,形成图 9(b)中的组合直线模式2。此外,本文方法提取出3个与简单直线模式无关联建筑物的组合直线模式,例如,图 9(c)中形成组合直线模式的建筑物在图 9(f)中与简单直线模式无关联。本文方法识别提取的组合直线模式基本符合“建筑物—模式构件—组合直线模式”的多层次认知特点,如图 9(a)中以简单直线模式作为模式构件和图 9(c)中由面积大小差异明显建筑物组合成模式构件,进而由多个具有相似特征的模式构件形成组合直线模式。对试验2的结果进行统计、对比分析可知,本文方法提取出6个组合直线模式,对比试验提取出21个简单直线模式,提取的所有组合直线模式与对比试验结果中13个简单直线模式存在相交或者包含的关系。分析可知,现有研究的直线模式认知特征和识别方法并不适用于组合直线模式,而本文所提方法则可以识别出局部异质性明显的建筑群内涵的组合直线模式。
图 9 试验结果细节对比 Fig. 9 Experiment result detail comparison |
本文提取直线模式时未顾及环境上下文的约束,如道路网、水系等地理要素对城市空间形态的划分,在实际应用(如制图综合、多尺度表达等)中可以根据实际需求,结合邻域环境约束对提取的建筑群组合直线模式进行分解与重构。
视知觉拓扑理论认为人的认知具有“大范围首先”的性质[22-23],这解释了组合直线模式虽然在局部范围内存在一定程度的异质性,但在整体上符合直线模式认知特征的现象,反映了模式在认知意义上的整体性、组合性和层次性。本文所提的组合直线模式重点关注模式内建筑物的可组合性,可组合性主要通过两个条件判定,一是建筑物构成扩展对齐分布,二是建筑物之间具有一定的邻近程度。本文在识别提取组合直线模式时并未对邻近程度进行量化约束,因为邻近程度的考量需要结合实际应用环境,本文所提方法主要从技术的角度为识别提取组合直线模式提供一个可行的数据增强方案。对本文试验1中提取的组合直线模式内组合的建筑物间最短距离进行计算,统计结果如图 10所示,其中最小值为2.5 m,最大值为26.0 m。以制图综合为例,建筑物之间的最小间隔通常为0.5 mm[26],如果综合目标比例尺为1∶25 000,则实际距离约束为12.5 m,由图 10统计结果可知本文提取的组合直线模式中有61组组合建筑物符合邻近程度的约束,如果试验中加入距离约束条件Distance < 12.5 m,则识别结果如图 11所示,共识别出12个组合直线模式。
图 10 组合建筑物最短距离统计 Fig. 10 Statistics on minimum distance between combined buildings |
图 11 考虑距离约束的组合直线模式提取 Fig. 11 Combined collinear pattern extraction considering distance constraints |
建筑物的可组合性也可以延伸为模式与模式之间的可组合性,如图 12(a)所示的组合直线模式完全由两个邻近且具有相似分布特征的简单直线模式(图 12(b))组成。模式之间的可组合性对研究具有复杂组合形态和多层次性的直线模式具有重要的理论指导意义。
图 12 模式间的可组合性 Fig. 12 Combination of different patterns |
图 13 短轴长度比影响 Fig. 13 Influence of minor axis length ratio |
视觉认知易受人类的个体差异性和主观性的影响,因此对基于视知觉空间认知的模式识别结果的定量评价一直是该领域的难题。目前,通过与人眼识别的结果进行对比来评价识别结果是普遍被认可的方法[2, 4, 9, 18-19]。本文通过问卷调查的方式评价结果的可靠性,调查对象为4名制图生产单位工程师,6名助理工程师和30名地图专业学生。分别对比3.1节两组试验数据的调查结果与所提方法的识别结果,以准确率和召回率对识别结果进行评价,评价结果见表 3,结果表明本文方法的识别结果是可靠的。
表 3 识别结果评价 Tab. 3 The performance evaluation for pattern extraction
准确率 | 召回率 | |
试验1 | 88.9 | 94.1 |
试验2 | 83.3 | 100 |
4 结论 目前,建筑群直线模式的研究仅考虑了模式内建筑物间的同质性以及模式内、外建筑物间的异质性。本文针对具有局部异质性的建筑群直线模式识别问题,提出基于模板匹配的建筑群组合直线模式识别方法。本文旨在提供一个建筑群空间分布模式识别的技术方案,在识别提取组合直线模式过程中未考虑组合建筑物的空间邻近程度和其他地理要素的约束,具体考虑的约束条件要结合实际需求,在以后的工作中会对此继续研究。此外,会进一步分析不同数据特点对阈值设置的具体影响,以及对复杂组合形态和多层次性的直线模式进行研究。
作者简介 第一作者简介:行瑞星(1991—), 男, 博士生, 主要研究方向为模式识别与自动制图综合。E-mail: xingrxgis@whu.edu.cn通信作者:武芳, E-mail:wufang_630@126.com
初审:张艳玲
世界第一部海拔八千米以上雪山地图集问世
院士论坛丨李德仁:新基建是引领中国从第一个百年发展走向第二个百年发展的重要举措
山东省大数据中心招聘
《自然资源调查监测质量管理导则(试行)》印发