基于GIS的数字河网特征信息提取研究
作者: 钟国雄 朱正平
摘要 河网水系是重要的地形特征要素,数字河网的提取则是DEM数据一个重要的应用方面,在此基础上进行水文信息参数计算,对于水文研究具有重要的意义。以九江市为研究区域,基于DEM数据,运用ArcGIS的水文分析模块对研究区进行小尺度的河网特征信息提取与分析。结果表明,基于DEM提取数字河网的精度和效率能够达到使用要求,河网密度等参数的计算结果能反映实际的情况,具有较高的可靠性,可进一步应用于水文研究。
关键词 数字高程模型(DEM);数字河网;ArcGIS
中图分类号 P 333 文献标识码 A 文章编号 0517-6611(2023)07-0231-04
doi:10.3969/j.issn.0517-6611.2023.07.053
Research on Information Extracting of Digital River-network Based on GIS
ZHONG Guo-xiong, ZHU Zheng-ping
(School of Geosciences, Yangtze University, Wuhan, Hubei 430100)
Abstract River network is an important topographic feature element, and the extraction of digital river network is an important application of DEM (digital elevation model) data. On this basis, the calculation of hydrological information parameters is of great significance for hydrological research. Taking Jiujiang City as the research area, based on DEM data, the hydrological analysis module of ArcGIS was used to extract and analyze the small-scale river network feature information in the research area. The results showed that the accuracy and efficiency of extracting digital river network based on DEM could meet the requirements of use, and the calculation results of river network density and other parameters could reflect the actual situation, which had high reliability and could be further applied to hydrological research.
Key words Digital elevation model (DEM);Digital river-network;ArcGIS
作者简介 钟国雄(1995—),男,江西赣州人,硕士研究生,研究方向:3S的应用。通信作者,讲师,博士,从事数字油田研究工作。
收稿日期 2022-08-25
DEM(digital elevation model,数字高程模型)通过有限的地形高程数据实现对地面地形的数字化模拟,是地表形态的一种数字化表达,蕴涵丰富的地形地貌、水文信息[1]。同时DEM数据是进行水文分析的重要输入数据,相较于传统方法,基于DEM数据提取的精度可以满足水文模拟与生产的需要,这些水文信息对构建水文特征模型有很重要的作用,也对自然灾害的重点监测与防治等领域有重要的科学指导意义。
最初是从地形图中寻找分水线和谷点,由最低点沿着谷点逐渐向上搜索,以获取河流网络参数和流域特征。这种方法耗时耗力且存在人为差异,随着GIS的发展,研究转向基于DEM的数字化与自动化提取研究[2]。O’Callaghan等[3]提出坡面流模拟方法,根据水总是沿斜坡最陡方向流动,该方法认为应对DEM数据进行平滑处理,以减少洼地数目来提高处理效率,并提出了最初的单流向算法(simple flow direction)。Tribe[4]依据O’Callaghan等的算法,指出了产生坡面径流模拟算法的1个必要前提,即DEM中每个栅格单元都必须被赋予1个确定的水流方向。Garbrecht等[5]在此基础上做进一步的改进,改进后可以处理所有洼地区域,这种算法被称为 D8(deterministic eight-node)单流向算法,它是比较经典的单流向算法,由于算法简单有效,该方法得到了国内外学者较为广泛的应用。孔凡哲等[6]研究了目前对平坦区域以及洼地的处理方法,认为通过增加输入地形高程信息,可以减少数字地形缺陷的生成,从而可以更好提取河网水系。许捍卫等[7]以秦淮河流域为例,引入遥感信息来弥补DEM缺陷的方法可较好地提取该流域数字水系。
总体来看,现有研究大多数是以DEM数据为基础,或引入其他数据,或对已有的算法进行改进,然后在GIS水文分析工具的支持下进行水文信息的提取,研究尺度或是针对全国范围的大尺度研究,或是针对某个流域的小尺度研究。根据上述国内外研究情况,笔者以九江市为研究区,基于DEM数据,运用GIS的水文分析模块对研究区进行小尺度的河网特征信息提取与分析,以期为九江市数字化水文建设与管理提供数据支持。
1 研究区概况
九江市位于江西省最北部,地处赣、鄂、湘、皖4省交界处,位于长江中下游南岸(28°41′~30°05′N,113°56′~ 116°54′E)。研究区内的水系资源十分丰富,境内主要有修河水系、长江和环鄱阳湖区河流组成的三大水系,研究区的DEM如图1所示。
2 数据来源与处理
2.1 数据来源
SRTM(shuttle radar topography mission)DEM是由美国国家航空航天局(NASA)和国家空间信息情报局(NGA)共同制作完成的雷达影像数据,该数据覆盖地球80%以上的陆地表面,公开出来的覆盖中国区域的精度为90 m,现通过地理空间数据云(http://www.gscloud.cn/)获得该DEM数据。此外,还有比例尺为1∶100万的流域水系图作为提取的参照对象进行准确度判别。所用的全部数据均采用WGS1984_UTM_Zone_49N投影坐标系统。
2.2 数据预处理
原始的DEM数据会存在一些洼地,它本质上是数据中存在的非连续变化像元,且相邻像元值均较高。它既可能是由 DEM分辨率的高低不同而产生,也有可能是DEM生成过程中的误差所导致。由于错误的洼地会导致在计算水流方向时和计算累积栅格时出现与原本方向不同的错误,甚至是水流倒流的现象,导致水流方向计算结果不正确。对DEM进行预处理是为了使每个栅格单元都有一个明确合理的水流方向[8]。用ArcGIS中的填洼工具进行填洼,预处理的流程如图2所示。
3 研究方法
数字河网特征信息的提取包含以下5个步骤:①栅格单元水流方向的计算;②栅格单元汇流累积量的计算;③河流网络的提取;④河流网络的分级;⑤河网链接和矢量化。
3.1 水流方向计算
水流方向指一个栅格的流量在离开该栅格时的方向,它决定了地表径流的方向及栅格间流量的分配[9]。Skidmore[10]提出将水流方向约定用2的n次方表示(n从0开始),按照顺时针分别为递增,共8个流向。该方法简化了自然状态下多种可能的水流方向,使水流明确偏向某个栅格,由于该方法对 DEM的处理简单,概括性和实用性都很强,是目前应用范围最广泛的方法[9]。
3.2 汇流累积栅格计算
在模拟地表径流的过程中,基于水流方向数据计算汇流累积量,它代表着区域内每个栅格单元点的累积量[11]。每个栅格单元的汇流累积量表示上游栅格所产生的汇流总量,而栅格汇流累积量近乎为0则很可能作为流域的分水岭,河谷则相反。
3.3 河网提取
如果某一栅格点的汇流累积量超过了设定的一个最小集水面积阈值,则该栅格出现在河道上并成为水系的一部分。即通过设置合理阈值,提取栅格中大于最小汇流累积量的栅格,将属性赋值为1并定义为河道,栅格之间互相连接就可以得到河网,而该阈值决定了河网提取的精度和详细程度,也影响着该地区的河网密度以及后续子流域的划分。
3.4 河网分级
河网分级工具的本质是根据栅格汇流累积量大小所进行的分级,并利用这些差别将河网主次关系加以区分,从区分结果中分析出水文规律并对理解该区域的河网情况有很好的作用,河流的特征可以仅从所分配的级别中获取一些典型的情况。
3.5 河网链接和矢量化
对流量栅格进行提取可得到离散的栅格河网的形状图,但这个数据结果表示的是一些大于或等于一定累积量的栅格点,尽管看起来像连续的河流,但是经过放大后观察,实质上是一些离散点。河网链接工具将这一系列的离散点依次连接,点成线,使其看起来像河网一样的弧段,这样便于判断河流的方向,并为后续的河网矢量化作数据上的准备,河流的链接关系记录着河网水系之间的结构信息。
4 结果与分析
4.1 河网提取阈值的确定与分析
如何确定一个合理提取的阈值是河网水系的提取与分析的关键[12]。当设置提取的阈值越大时,在水流累积栅格图层中超过该阈值的栅格就越少,提取到的河网也就越稀疏。为了能够找到最合适的阈值,结合研究区的实际地形特征,经过多次试验比较,从而找到最合适的阈值。
在GIS软件水文模块中选择栅格计算器工具,设定一组不同的集流阈值,提取得到多个栅格河网,并对比这些结果的差异。提取出的数字水系(蓝色)和参照河网(红色)的重合度对比如图3所示。
通过不断对比试验,分别选取阈值为1 000、1 500、2 000、2 500、3 000、4 000的数字水系和现有的1∶100万参照河网进行叠加对比。发现提取出的数字水系(蓝色)和参照河网 (红色)河流主干流基本吻合。但是在东北部的边界区域以及东南部的一小块区域,不管提取阈值如何,参照河网与提取河网完全不能重合。对研究区实地以及对提取算法研究了解后发现,东北部的边界区域为流经研究区内的长江河段,东南部的一小块区域为研究区内的鄱阳湖段,这些区域内包含大量的坡度较小的平坦的区域,而由于提取算法存在局限性,导致在这些区域出现提取的误差。但只是研究区的小部分,并未对整体造成实质的影响,属于可接受的误差。
从整体来看,当阈值较大,为4 000、3 000等时,各主要支流的主河道河网消失,支流河网长度也有明显缩短的趋势,缺失了很多细节,不能较为真实地呈现出水系的样貌;而当阈值设为1 000时,提取的河网过于详细,对比可以很明显发现提取的河网出现较多的长度较短但实际不存在的伪河道,这与实际的情况并不一致,这是研究工作中需要注意的问题。经过详细对比后,发现当阈值为1 500 时,发现在主干流区河流基本吻合,主要支流相似度很高,只是在次级支流区域的分支里拟合性略差,考虑到数字河网提取时的误差,误差也在允许范围内。最终设置阈值为1 500,提取出的栅格水系图与现有的1∶100万九江水系图在绝大部分区域较为吻合。