学术咨询

让论文发表更省时、省事、省心

决策树分类模型的住宅建筑物图斑识别

时间:2021年03月20日 分类:电子论文 次数:

摘要:针对大范围内住宅建筑图斑自动识别较为困难的问题,该文提出基于决策树模型的分类方法,利用基础测绘中高精度的建筑数据、地理省情监测数据、POI数据、DSM、DEM、腾讯大数据等,以建筑物本身特征和建筑物不同邻域内建筑类型相关因素的空间特征作为决策

  摘要:针对大范围内住宅建筑图斑自动识别较为困难的问题,该文提出基于决策树模型的分类方法,利用基础测绘中高精度的建筑数据、地理省情监测数据、POI数据、DSM、DEM、腾讯大数据等,以建筑物本身特征和建筑物不同邻域内建筑类型相关因素的空间特征作为决策变量,分别采用QUEST、CHAID、C&RT和C5.0算法构建用于住宅分类识别的决策树模型并进行优选。以济南市(不含原莱芜市)为研究区域进行了实验,结果显示4个模型均未出现过拟合现象,可以用于住宅建筑图斑识别。

  关键词:住宅建筑;周边特征;决策树模型;C5.0;混淆矩阵;接受者操作性能曲线

地理研究

  0引言

  近年来,随着我国社会经济的不断发展,城市化进程进一步快速推进,尤其是城市地区土地利用类型中建设用地呈现增长趋势。房屋建筑是人类活动最主要的场所,其数据信息在城市规划[1]、人口估计[2]、应急救援与灾害评估[3]等方面的应用中都具有极其重要的意义。

  目前对于建筑物的提取研究已有多年,方法也较为成熟,主要方法有以下方面:基于模板匹配的地物提取方法[4]、基于知识的目标提取方法[5]、基于面向对象技术的方法[6]、基于知识和面向对象相结合的方法[7]、基于机器学习的方法[8-9]等。其中,基于机器学习的方法是近些年来研究的重点和热点,常见的方法有决策树分类、基于规则分类、神经网络、支持向量机(supportvectormachine,SVM)和朴素贝叶斯分类等[10]。以上研究均为基于遥感数据的建筑物识别,主要目的是为了提取出建筑物数据,而对于建筑物更进一步的详细类型则没有进行划分。

  而建筑物中的住宅与人类生活息息相关,其分布和位置以及周边设施等直接影响居民的生活质量,如果能获取精细住宅建筑数据,那么对于居民生活环境分析、基础设施均衡化评价、常住人口分布、政府规划决策等方面提供精准有效的辅助支撑。目前,对于住宅建筑的识别也有一些研究,文献[2]基于建筑物三维空间分布数据,运用面向对象分类方法剔除非住宅建筑物,得到住宅建筑分布数据;文献[11]中通过对遥感影像进行目视解译,通过矢量化方法提取居住建筑图斑。这些方法都停留在结合地图和实地调查或者影像的目视解译层面,提取数据效率低,人工工作量大,不适于大范围区域。近些年,我国的基础测绘建设逐渐完善,成果资源丰硕,对于海量数据的深度挖掘与应用也是近些年测绘行业关注和探索的重点。

  本次研究以山东省济南市(不包含原莱芜市)范围内基础测绘中高精度的建筑基底图斑数据为基础,结合地理省情监测数据、兴趣点(pointofinformation,POI)数据、数字地表模型(digitalsurfacemodel,DSM)、数字高程模型(digitalelevationmodel,DEM)、腾讯大数据等,按照城市和农村不同区域,实现住宅建筑识别,探讨和研究济南市住宅建筑图斑高效提取方法及其分布形态。由于具有可读性、分类速度快、能够生成分类规则集等优点,因此本研究选择决策树算法进行建模。

  1研究区域

  济南市位于山东省中部,是山东省省会城市,地理位置介于36°01′~37°32′N,116°11′~117°44′E,面积7998km2;南部为泰山山地,北部为黄河平原,背山面水,地势南高北低,地形复杂多样[12]。

  2018年年底济南市常住人口746.04万人,户籍人口655.90万人,全市地区生产总值7856.56亿元[13]。济南市地表覆盖类型以种植业为主,其次为林草覆盖和房屋建筑(区),房屋建筑(区)主要集中在济南市中部低海拔平原地区。2019年1月,原莱芜市所辖区域划归济南市,由于本次研究数据现势性主要为2018年,所以研究区域为未进行行政区划调整前的济南市范围。

  2数据来源

  2.1基础测绘数据

  基础测绘数据是测绘行业最全面、基础的数据成果,特别是及时更新矢量数据,已经实现每年甚至更短时间的更新频率,具有较强的现势性。本文采用基础测绘及时更新数据中的建筑基底面状数据作为基础数据;此外,POI数据是最重要的辅助数据。数据现势性为2018年。

  2.2地理省情监测数据采用房屋建筑(区)和城镇综合功能单元、城市空间格局数据。数据现势性为2018年6月30日。

  2.3激光点云数据和DEM数据利用激光点云数据中的DSM数据,结合DEM数据,可以获取建筑物高度信息。DSM和DEM现势性分别为2014年、2015年。

  2.4腾讯位置大数据社交位置数据与人类活动有很强的相关性,获取腾讯大数据平台上济南市范围内社交位置数据,按照白天和晚上不同时段进行获取,即从一定程度上可以反映人为活动及聚集密度。数据现势性为2018年7月。

  3研究方法

  济南市建筑物图斑约1.6×106个,涵盖住宅、工商企业、机关单位、公共设施等类别的建筑物,还包括一些附属建筑和临时性建筑。本次研究目的主要为从海量建筑基底图斑中识别出住宅建筑图斑数据,因此对于非住宅类的建筑数据不再进行详细划分。而由于不同区域住宅建筑在形状、高度、聚集情况等有所差异,需要按照区域及住宅不同的类型建立多层次的分类系统。

  3.1特征变量选择

  用于住宅识别的变量首先应当包括建筑物自身的属性特征,包括几何属性和通过其他数据获取的属性。此外,地理学第一定律和地理学第二定律分别说明了事物的空间相关性和空间异质性,本文引入了大量的周边空间特征变量,根据住宅建筑自身及周边位置事物之间的关系特征进行识别。

  3.1.1建筑物图斑特征

  建筑物图斑特征即建筑物图斑自身特征,包括建筑自身的几何特征和由其他数据确定的属性特征。几何特征变量主要有:层数、面积、周长、节点数、朝向(与正北方向夹角)、长宽、形状因子等。

  3.2决策树分类算法模型选取

  决策树模型是通过训练形成一组决策规则并且可以对未知对象进行预测或分类的树状系统,它主要包括两个阶段:分裂和剪枝。决策树的构建过程是一种从上向下、递归分治的过程,先根据特征变量选择最有效的样本集划分方式,形成新的决策分支;后对分支进行修剪来优化决策树。常见的决策树分类算法有以下方面。

  1)卡法自动交互检测算法(chi-squaredautomaticintera-ctiondetector,CHAID)。CHAID[14]算法是一种使用卡方统计选择特征变量(卡方值最显著特征),从而建立决策树的分类方法,其特征变量选择和分支点选择同时进行。剪枝策略为预剪枝。2)快速无偏有效的统计树(quickunbiasedefficientstat-isticaltree,QUEST)。QUEST[15]算法是对CHIAD的改进,该算法将特征变量选择和分支点选择分开进行。如果特征变量为分类变量,则采用卡方检验;如果特征变量为有序或连续变量,则使用F检验;选择P值最小且小于显著水平α的特征变量作为当前最佳分支变量。剪枝策略为后剪枝。

  4结果与分析

  4.1决策树分类模型精度评价

  采用决策树分类模型,对城区、农村分区域进行建模,训练集、验证集的混淆矩阵正确率。可以看出,4个决策树分类模型中,C5.0模型的精度最高。训练集、测试集精度分别为城区96.6%、94.81%,农村97.73%、95.14%。农村地区模型略优于城区。其他3类模型精度差异不大,均未超过90%,远低于C5.0模型。所以C5.0模型更适用于建筑物识别分类。

  5结束语

  本文利用测绘行业多源、多尺度数据,基于多种决策树模型,实现济南市城市和农村不同区域建筑物图斑分类识别,并且对模型结果做精度比对评价,实现了对测绘大数据的有效挖掘,同时也拓宽了现有地理信息数据的维度,对地理省情监测统计分析等应用工作进行了有效的探索。

  计算机论文范例:计算机应用技术与信息管理的整合

  主要结论如下:本文用于建筑物图斑识别的变量除了建筑物自身属性特征外,结合地理学第一定律,引入了周边不同缓冲空间范围内其他影响因地区和农村地区分类特征变量重要性进行分析,城市地区建筑物图斑识别特征变量重要性前6位依次为:层高、地表覆盖类型、节点数、周边100m内建筑物数量、周边50m建筑物数量、宽等;而农村地区依次为周边50mPOI数、地表覆盖类型、距离办公商业最近距离、距离交通运输点距离、面积、周边50m道路总段数等。

  可以看出:城市和农村用于识别的特征变量有较大差别,城市地区特征变量贡献比较大的为建筑物自身特征,说明城市住宅和非住宅建筑物细节特征差异比较明显;而农村地区建筑自身细节差别较小,需要依据周边特征帮助区分。

  参考文献

  [1]李垚,赵卫东,卫刚.城市规划建筑图纸电子报批系统实施与关键技术[J].计算机应用,2007,27(S2):242-243.(LIYao,ZHAOWeidong,WEIGang.Implementationandkeytechnologyofelectronicapprovalsystemforurbanplanningandbuildingdrawings[J].JournalofComputerApplications,2007,27(S2):242-243.)

  [2]卓莉,黄信锐,陶海燕,等.基于多智能体模型与建筑物信息的高空间分辨率人口分布模拟[J].地理研究,2014,33(3):520-531.(ZHUOLi,HUANGXinrui,TAOHaiyan,etal.Highspatialresolutionpopulationdistributionsimulationbasedonbuildinginformationandmulti-agent[J].GeographicalResearch,2014,33(3):520-531.)

  [3]眭海刚,刘超贤,黄立洪,等.遥感技术在震后建筑物损毁检测中的应用[J].武汉大学学报(信息科学版),2019,44(7):1008-1019.(SUIHaigang,LIUChaoxian,HUANGLihong,etal.Applicationofremotesensingtechnologyinearthquake-inducedbuildingdamagedetection[J].GeomaticsandInformationScienceofWuhanUniversity,2019,44(7):1008-1019.)

  作者:牛宵

NOW!

Take the first step of our cooperation迈出我们合作第一步

符合规范的学术服务 助力您的学术成果走向世界


点击咨询学术顾问