基于Logistic回归模型的南昌市土地利用演变驱动力分析
作者: 顾顺业
摘 要:应用Logistic回归模型,通过深入挖掘和整合气象数据、生态指标、社会经济和其他多源监测数据,全方位地剖析江西省南昌市土地利用/土地覆盖变化(Land-Use and Land-Cover Change,LUCC)背后的主要驱动因素。研究表明:南昌市土地利用类型整体呈现出向建设用地转移的趋势,且主要来源是耕地;影响耕地分布的关键因素是坡度、年均温、夜间灯光;影响林地分布的关键因素是坡度、年均温、人口密度;影响草地分布的关键因素是坡度、人口密度;影响建设用地分布的关键因素是坡度、年均温、夜间灯光;影响水域分布的关键因素是坡度、年均温、夜间灯光;影响未利用地分布的关键因素是高程、年降水、夜间灯光、人口密度。
关键词:土地利用;驱动力;Logistic回归模型
中图分类号:F301.2;F224 文献标志码:A 文章编号:1674-7909-(2023)17-114-4
0 引言
土地利用/土地覆盖变化(Land-Use and Land-Cover Change,LUCC)是全球环境变化和可持续发展领域的热门和前沿研究主题,是多个国际项目交叉研究的核心内容之一。LUCC的变化是一个复杂的过程,受到许多因素的影响,包括人类活动、自然变化、宏观经济、环境政策等。
国内学者如李宇飞等[1]利用CA-Markov模型研究了阿克苏地区土地利用变化并进行了预测;周晨晴等[2]使用GIS-Logistic耦合模型确定了2009—2014年甘肃省广河县土地利用变化及其驱动因素;卞正富等[3]通过对遥感影像和景观格局指数分析的方式,研究了1979—2001年江苏省徐州市煤矿区土地格局变化;王夏琰等[4]探究了甘肃省土地利用结构变化及其驱动力;于兴修等[5]研究发现,城市发展和人口变迁等因素是土地利用变化的直接驱动因素,而地形地貌、土壤性质和气候等因素是土地利用变化的显著驱动因素,且这些因素相互关联。
笔者基于前人研究成果,通过分析典型地区江西省南昌市的LUCC情况及其驱动机制,探讨社会、经济、生态之间的相互作用规律,为优化土地利用方式、推进城市可持续发展提供参考。
1 数据来源和研究方法
1.1 研究区域概况
南昌市地处江西省中部偏北地区(东经115°27′~116°35′、北纬28°10′~29°11′),土地面积约7 157 km2(占全省总面积的4.4%);全境山、丘、岗、平原相间,其中岗地低丘占34.4%,水面占29.8%,平原占35.8%,自然资源丰富。
1.2 数据来源与处理
南昌市土地利用现状图、遥感监测数据、数字高程模型(Digital Elevation Model,DEM)来源于中国科学院地理科学与资源研究所的资源环境科学与数据中心,社会经济发展相关数据来源于《南昌统计年鉴2020》。此外,笔者根据第二次全国土地调查土地分类系统,将研究区域的土地分为6个主要类别,即耕地、林地、草地、水域、建设用地及未利用地。
1.3 研究方法
1.3.1 土地利用/覆被转移矩阵
土地利用/覆被转移矩阵能够很好地反映LUCC的结构特征及土地利用/覆盖类型之间的过渡方向,其可以通过定量的方式展示研究期内(初期到末期)各种土地利用类型的面积是如何变化的。
1.3.2 二元Logistic模型
该建模技术依靠样本数据为相关变量创建回归系数,并通过这些系数讨论模型中因变量和自变量之间的关系。如果一个事件发生的概率是[p](0≤[p]≤1),则1-[p]就是事件不会发生的概率,这个概率就可以用Logistic函数计算,公式为
[p=expβ0+β1x1+β2x2+…+βnxn1+expβ0+β1x1+β2x2+…+βnxn] (1)
式(1)中:[p]是某一土地利用类型的出现概率,p值越大则表示出现该土地利用类型的可能性越大;[xn]表示第[n]个驱动因素;[β]是二元Logistic回归方程中的偏回归系数;[expβ]表示土地利用类型出现的频率与不出现的频率之比,用于反映相关影响因素对某一土地利用类型出现概率的贡献大小。
Logistic函数是一个协变的非线性函数。如果对公式进行Logit变换,就可以得到一个线性公式。
[y=lnp1-p=β0+β1x1+β2x2+…+βnxn] (2)
式(2)中:[p]为土地利用/覆被类型出现在空间单元出现的概率;[βn]是第[n]个驱动因素的逻辑回归系数;[β0]为常数项。
另外,[p(1-p)]称为1组事件的发生比(Odds),通过除法得到两组发生比的发生比率[Odds Ratio,OR,即[expβ]],OR在测量关联时可用来解释Logistic回归模型中自变量对事件概率的作用。因此,其常用于对Logistic回归模型回归系数的解释,以及表示一个单位变化引起另一个单位变化的量的大小。
1.3.3 ROC曲线和AUC面积
受试者工作特征曲线(Receiver Operating Characteristic,ROC曲线)的主要分析工具是一个画在二维平面上的曲线——ROC曲线,平面的横坐标是False Positive Rate(假阳性率),纵坐标是True Positive Rate(真阳性率)。对某个分类器而言,可以根据其在测试样本上的表现得到一个TPR和FPR点对。这样,此分类器就可以映射成ROC平面上的一个点。调整这个分类器分类时候使用的阈值,就可以得到一个经过(0,0)、(1,1)的曲线,这就是此分类器的ROC曲线。ROC曲线下与坐标轴围成的面积(Area Under Roc Curve,AUC)可用来标志分类器的好坏。通常,AUC的值介于0.5~1.0,AUC值较大则代表分类器性能较好;一般认为,AUC在0.5以上可以接受,0.7以上优秀。
2 南昌市土地利用转移分析
利用ArcGIS软件的空间分析功能,对南昌市2010—2020年土地利用现状图进行叠加分析,导出属性表;利用Excel软件的数据透视表功能对上述属性表进行整理汇总,得到如表1所示的2010—2020年南昌市土地利用转移矩阵。由表1可以得出南昌市每种土地利用类型的占比,如表2所示。
由表1、表2可知,南昌市土地以耕地居多,近10年占比都在50%以上,对应了南昌市作为江西省农业主产区的特点。2010—2020年,南昌市土地利用类型转变比较频繁,共有39 043.98 hm2的土地利用类型发生了转变,占总土地面积的5.4%。其中,3 895.47 hm2的耕地转化成林地,2 242.98 hm2的耕地转化为水域,15 357.51 hm2的耕地转化为建设用地,不难看出退耕还林政策的实施成效及建设用地面积的大量增加;有4 060.71 hm2的林地转化成耕地,3 128.76 hm2的林地转化成建设用地;草地的变化相比其他地类不算太大,转化面积均未超过200.00 hm2,最大值来自草地转化为水域的188.97 hm2;水域转化为耕地2 173.41 hm2,转化为建设用地1 195.65 hm2;建设用地有1 815.30 hm2转化为耕地,还有310.68 hm2转化为水域;未利用地有1 870.20 hm2转化为水域。整体来看,南昌市土地利用类型整体呈现出向建设用地转移的趋势,且其主要来源是耕地。
3 土地利用类型分布的驱动机制分析
3.1 驱动因素的选择
由于不同土地利用类型及其变化的复杂性和非线性分布,以及影响因素会受到不同研究区域和不同时间段的影响,因此影响因素的选择应基于完整性、数据可用性和可量化的原则。笔者综合考虑以往学者选取的各类驱动因素,最终选取了气候环境因素(年降水、年均温)、社会经济因素(夜间灯光、人口密度、生产总值)、地形影响因素(高程、坡度、坡向)3大类共8个驱动因素。
3.1.1 年降水、年均温
不同的土地利用类型会反映不同的气温和降水量规律。对于南昌市这种四季气温变化明显和降水量较大的城市,更能看出每一种土地利用类型对应的驱动因素。
3.1.2 夜间灯光、人口密度、生产总值
夜间灯光、人口密度、生产总值三者息息相关。由于我国城市化进程加快,人口快速流入城市,城市的生产总值会有所增加,夜间灯光也会发生变化,用地类型则会向建设用地靠拢。
3.1.3 高程、坡度、坡向
坡度越平缓的地区,越可能发生土地类型的变化。这是因为平坦的土地基础较好,容易产生变化。而坡向会和光照、气温、天气产生关联,从而使用地类型发生变化。因为江西省多山,所以此研究考虑了高程的影响。
3.2 数据选择
在ArcGIS应用程序中,使用“创建随机点”工具随机选择了南昌市的10 000个点,使用“空间分析”模块中的“对点提取数值”工具对10 000个点中的每个点分配8个影响因素的数值,之后导出属性表并将数据导入SPSS应用程序进行数据处理和分析。
3.3 二元Logistic回归
将10 000个点导入SPSS软件之后,对每种土地类型进行二元Logistic回归运算,汇总各土地利用类型的运算结果,去除显著大于0.05的要素,结果见表3。
发生比率OR或[expβ]可以比较直观地反映LUCC和8个驱动因素之间的具体关系以及各自的影响程度。例如,如果回归系数[β]>0,那么当自变量增加一个单位,发生比率会增加[expβ]倍,反之亦然。计算结果见表4。
由表4可知,影响耕地分布的主要正相关因素有坡向和年均温,发生比分别为1.003、1.441,表明耕地一般年均温会高一些,利于作物生长,同时耕地分布在坡向大的区域;而坡度、夜间灯光与耕地的分布呈负相关,发生比为0.968、0.962,说明南昌市的耕地多分布在灯光较弱的地区(离城区较远),且在分布在坡度比较缓和的区域(土地平缓利于耕作)。
对于林地来说,比较有代表性的驱动因素是坡度,说明一般林地分布在比较陡峭、坡度较高的区域,如森林公园和林场,甚至农业大学内部的林地多依山分布这一点可以印证;而与林地分布呈负相关的主要是人口密度和夜间灯光,因为南昌市大部分林地都距市区很远,人口分布少,灯光也会弱很多。
草地的分布与坡度有比较明显的正相关,说明草地多分布在坡度较大的地区,其他如高程、坡向和年降水都有比较接近的正相关[expβ]值;其负相关因素和林地相似,主要与夜间灯光和人口密度有关。虽然其解释与林地类似,但是还可以看出一个问题:南昌市主要夜间灯光集中在城区,但是草地分布和夜间灯光呈负相关,这侧面说明南昌市主城区绿化还较为缺乏,可以在未来进行增加。
水域的分布主要与坡度和年降水量有明显的正相关性;因为南昌市的地理环境及江西省的地理环境特征,南昌市的水域一般分布在坡度高一点的地区,降水量也相对较多。水域的分布主要与夜间灯光、高程呈负相关,说明南昌市水域一般分布在海拔较低的地区,且其周围的灯光也比较少,因为无论是湿地公园还是湖泊都离城区较远。
影响建设用地分布的最主要驱动因素是坡度、年降水,且呈负相关,即建设用地多分布在坡度较低的地区,并且建设用地多在城区(由于热岛效应等原因,导致当地降水较少);建设用地的分布与年均温、夜间灯光、人口密度呈正相关(这符合实际情况),因为夜间灯光亮度高的区域集中了大量人口,气温也会较高,同时是城市经济发展较好的地区。
未利用地主要为一些荒地,受高程、夜间灯光和人口密度的影响最大,且都呈负相关。这说明这些未利用地一般分布在海拔较高的地区,人迹罕至,灯光分布少。
笔者运用ROC法检验回归模型的拟合优度。一般如果ROC曲线下的面积AUC>0.5,可以说明模型拟合较好,大于0.7可以看作优秀。经过SPSS运算,耕地、林地、草地、水域、建设用地和未利用地的AUC值分别为0.718、0.786、0.782、0.782、0.900和0.939,均大于0.7,表明选取的8个驱动因素比较合理,而且回归模型的预测和实际情况有统一性,模型拟合效果也很好,详见图1(部分图略)。
4 结论
笔者分析了2010—2020年南昌市LUCC变化的特点和驱动因素,得出以下结论。
第一,南昌市土地利用类型以耕地、林地、水域为主(超过全域面积的80%),建设用地主要分布在南昌市中部,未利用地主要分布在东北部。南昌市土地利用类型经历了一定的变化,但是总体的比例基本维持不变,保持了动态平衡,不过整体可以看作耕地向建设用地转移了一定规模(2%)的土地。
第二,显著影响南昌市耕地分布的因素有坡度、坡向、年降水、年均温、夜间灯光、人口密度,其中比较关键的影响因素是坡度、年均温、夜间灯光;显著影响林地分布的因素有高程、坡度、坡向、年降水、年均温、人口密度;影响草地分布的因素主要有高程、坡度、坡向、年降水、夜间灯光、人口密度;显著影响水域分布的因素有高程、坡度、坡向、年降水、夜间灯光、人口密度;显著影响建设用地分布的因素有高程、坡度、坡向、年降水、年均温、夜间灯光、人口密度;显著影响未利用地分布的因素有高程、坡向、年降水、夜间灯光、人口密度。
参考文献:
[1]李宇飞,张永福,赵玉,等.基于CA-Markov模型的阿克苏地区土地利用变化研究及预测[J].安徽农业科学,2022(21):74-80.
[2]周晨晴,刘淑英,王平.基于GIS-Logistic耦合模型的广河县土地利用变化及其驱动因素分析[J].甘肃农业大学学报,2018(3):118-125.
[3]卞正富,张燕平.徐州煤矿区土地利用格局演变分析[J].地理学报,2006(4):349-358.
[4]王夏琰,刘学录.甘肃省土地利用结构变化及其驱动力分析[J].甘肃农业大学学报,2007(4):97-102.
[5]于兴修,杨桂山.中国土地利用/覆被变化研究的现状与问题[J].地理科学进展,2002(1):51-57.