- 中原经济区空间俱乐部趋同研究
- 赵威
- 7426字
- 2020-06-25 06:03:00
四、研究思路与方法
(一)研究思路
本研究的研究思路如下:①利用探索性空间数据方法对中原经济区进行分组、识别及检验。②依据检验结果,把经检验存在趋同现象的各区域分组所包含的成员挑选出来,而后视其是否一阶相邻,把一阶相邻的成员逐一挑出。那么,这些在空间上一阶相邻的成员就共同构成了一个中原经济区空间趋同俱乐部。③依据空间趋同俱乐部形成的初始条件、结构特征以及地方的特色,按地方因子和具有地方效应的全局因子构建中原经济区空间趋同俱乐部影响因子框架。④依据2001—2017年的《中国城市统计年鉴》以及中原经济区各省份历年的统计年鉴和各地市历年的统计年鉴,统计空间趋同俱乐部各成员影响因子解释变量的数据,将上述各空间趋同俱乐部成员影响因子解释变量的统计数据引入固定效应的空间滞后模型和固定效应的空间误差模型,进行双重筛选,经过筛选,将显著性较强的影响因子逐一挑出,即完成了中原经济区各空间趋同俱乐部的影响因子筛选。⑤借助β趋同回归模型对筛选出的影响因子进行检验,根据检验的结果,再将上述筛选出的影响因子引入固定效应的空间滞后模型再次进行检验,用以判断上述影响因子筛选的结果。并与β趋同回归模型检验的结果进行比较,利用S-Plus软件生成的主成分分析报告,依据各个主成分对该空间俱乐部趋同作用程度的大小以及其生成的分析报告,确定该空间趋同俱乐部的重要影响因子、比较重要的影响因子和一般影响因子。在此基础上,对顺利通过双重检验的各空间趋同俱乐部的影响因子进行分析,可为中原经济区不同经济发展水平地区的经济协调发展提供政策借鉴,也可为中原经济区不同经济发展水平地区的经济持续增长提供分类指导。
(二)主要研究方法
空间趋同俱乐部识别、检验、影响因子筛选、影响因子检验以及空间趋同俱乐部形成和演进机制分析等工作,需要根据不同需求,构建不同的空间计量模型。本研究将借助计算机工具,利用不同软件,依据不同的研究内容选取合适的空间计量模型,对中原经济区各空间趋同俱乐部进行研究和探讨,本研究拟用到的主要研究方法如下:
1.空间俱乐部趋同识别方法(即分组方法)
空间俱乐部趋同的识别,首先要对研究区域进行区域分组,根据各区域组的空间相关性,判断该组是否存在空间趋同俱乐部。区域分组的方法较多,一类是采用预先设定的标准来分组,如Tsionas(2001)采用NUTS-3的分类方法对希腊进行区域分组。Gallo(2001)为了使初始组包括的区域数目大致相同,采取了5类划分标准,低于欧洲平均GDP的65%、欧洲平均GDP的65%~95%、欧洲平均GDP的95%~110%、欧洲平均GDP的110%~125%、高于欧洲平均GDP的125%。另一类是采用探索性空间数据分析方法进行区域分组,这种分组方法分两步走,第一步是构建一个空间权重矩阵。空间权重矩阵是模型化了的区域之间空间依赖性的最重要工具。或者更准确地说,每一个区域,都要通过被空间权重矩阵W内生引入的一个纯粹空间模式的方法与其邻居的区域发生联系(即每一个区域都是通过由空间权重矩阵定义的空间模式来与其邻居区域联系在一起的)。关于空间权重矩阵的定义有许多种,其中较为重要的有两种:一种是依据空间的相邻性,根据直接或间接相邻又可将研究空间的权重矩阵分成一阶相邻权重矩阵和二阶相邻权重矩阵等;第二种是依据研究区域的空间距离来构建空间权重矩阵。这两种方法构建的空间权重矩阵均具有很强的客观性,避免了很多人为因素的干扰。根据空间趋同俱乐部的概念和研究要求,本书将采用一阶相邻空间权重矩阵,对研究区域进行空间分组。公式如式(1-1):
上述矩阵中元素wij的取值规则为:
第二步是测度空间自相关,进行区域分组。空间自相关可以由探索性空间数据分析方法得到的Moran's I系数(Baumont et al, 2003)或由Getis-Ord统计量(Fischer, Manfred and Stirböck, 2006)来测度,进而进行区域分组。Moran's I系数的计算公式为式(1-2)(Anselin, 2000、2002、2003):
式(1-2)中,n是观测单元的数量,wij是空间权重矩阵W的一个元素,xi和xj是区域i和区域j观测值偏离均值的量,s0是标准化要素,其值等于空间权重矩阵要素的和,即。
如果把空间系数矩阵进行标准化处理,即每一行元素的和等于1,则式(1-2)就变成了式(1-3):
或者用矩阵表示为式(1-4):
其中,W是空间权重矩阵,X是观测值xi相对于均值的偏离量所组成的列向量。从式(1-4)可以简单地看出,Moran's I系数值介于[-1,1]之间,大于0表示正的空间自相关,小于0表示负的空间自相关。对于空间区域而言,如果区域与其“邻居”之间的相似性大于差异性,那么Moran's I系数大于0,反之亦然。利用Moran's I系数可以把研究区域划分为4种不同类型:HH型,即高收入的区域和高收入的邻居区域;LL型,即低收入的区域和低收入的邻居区域;HL型,即高收入的区域和低收入的邻居区域;LH型,即低收入的区域和高收入的邻居区域。其中HH和LL表示正的空间自相关性,即相似性特征集聚在一起;相反,LH和HL表示负的空间自相关性,即差异性特征集聚在一起(张伟丽,2009)。
此外,区域分组的方法还有CART等很多方法,在此不再赘述。
2.空间俱乐部趋同检验方法
空间俱乐部趋同检验的目的就是对上述具有空间自相关特性的区域组进行辨别,分别对利用探索性空间数据方法得到的4个区域组(HH组、HL组、LH组和LL组)进行检验,把存在空间俱乐部趋同的区域组检验出来。主要依据空间滞后模型、空间截面模型和空间误差模型进行检验。首先,在同一空间区域组内,进行绝对β趋同中的OLS回归估计,依据估计结果,得到各组的诊断性检验值。另外,为了确定各组的空间依赖模式(空间滞后模型或空间误差模型),利用拉格朗日乘数检验值(为LMERR、LMLAG)及其稳健性进行判断。Anselin(1998a)和Florax(1995)提出的决定原则,如果LMLAG比LMERR更显著,而且RLMLAG显著但RLMERR不显著,那么,用于判断的合适模型就是空间滞后模型。相反地,如果LMERR比LMLAG更显著,且RLMERR显著但RLMLAG不显著,那么合适的判断模型即为空间误差模型。
当对区域分组进行了空间自相关和空间异质性为目的识别后,如果得到的拉格朗日乘数检验值均不显著,且White检验值并不能拒绝同质性的原假设,那就意味着被识别的空间区域组内不存在空间俱乐部趋同现象;反之,则意味着可能存在空间俱乐部趋同现象,转而进入下一步的识别程序,即采用下述合适的空间计量模型来检验空间俱乐部趋同的存在性。
(1)空间滞后模型(The spatial autoregressive model)
在空间滞后模型中(式1-5),观测对象的空间相关性是由内生的空间滞后变量来反映:
式中上标j=1,2,…,n,分别代表本研究得到的n个空间区域组。代表的是属于第j个区域组的每一区域的人均GDP从初始时点0到终止时点T这一时段内的增长率向量,是属于第j个区域组的各个区域在初始时期的人均GDP向量,μ为服从正态分布的随机误差项,S是总向量,ρ为空间滞后系数,用来测度由外生引入的标准化权重矩阵所确定的空间模式反映的各空间区域之间的相互作用强度。空间滞后变量W是受空间权重矩阵影响的增长率向量。
由于随机回归向量存在,而且该回归向量常常与μ联系在一起,因此,这个模型若用OLS估计将会产生不一致的估计量,所以必须通过最大似然法ML或者工具变量法IV进行估计。
(2)空间横截面模型(The spatial cross-regressive model)
空间横截面模型(式1-6)的优势在于将空间效应与每一个对象的邻居结合起来,而且还保持了与空间溢出理论的强烈联系。在该模型中,空间滞后变量为外生的。
式中,包含在(n×h)阶矩阵Z中的h个外生空间滞后变量的影响是通过参数向量γ反映的。利用这个公式可以处理显著的空间溢出效应,可解释为条件趋同模型与可能影响增长率的空间环境变量的结合。矩阵Z有可能包括,也有可能不包括。当矩阵Z仅包括时,式(1-6)就变成了如下形式(式1-7):
在模型(式1-7)里只有空间滞后的初始人均GDP水平这一变量影响增长率,它同时估计了初始人均GDP水平对增长率的直接影响和空间滞后影响。
López-Bazo等(1999)提出的空间截面模型的形式为:
式中的τ和ρ是初始收入和增长率的待估空间滞后参数,εi是随机误差项,该模型的结构形式包含了和两个变量,前者是模型化了的全局性溢出效应,后者是模型化了的局部性溢出效应(S Alexiadis, 2004)。该模型具有3个优点:一是当空间效应被控制,它通过参数β服从了趋同的基本条件;二是它能够证实区域溢出效应在区域经济增长过程中的存在及大小;三是由于模型的结构形式包含有空间自回归模型和空间截面回归模型,前者是模型化了的整体溢出效益,而后者则是模型化了的局部溢出效应(S Alexiadis, 2004)。因此,可以在式(1-8)的结构里将由Anselin(2003)引入的全局性溢出和局部性溢出联系在一起。
(3)空间误差模型(The spatial error model)
当空间依赖被认为是通过忽略的空间变量而产生的效应时,空间误差模型是合适的,当其服从一个一阶过程时,空间误差模型形式为式(1-9):
式中λj为第j个空间区域组的规模参数,由它测度回归残差之间的空间相关程度,由于变量参数的有偏估计,用OLS的推断可能产生误导。因此,这个模型应由ML或GMM来估计。
这个模型(式1-9)还可以被改写成为(式1-10):
或者(式1-11)两种形式:
式中的γ=-λβ,式1-11称为空间宾德模型,该模型可用ML方法进行估计。
(4)绝对β趋同模型(Anselin, 1998a)
在空间俱乐部趋同检验时,选择空间滞后模型还是空间误差模型需要借助绝对β趋同回归模型中的OLS检验结果,根据检验的结果方可能确定下来是用空间滞后模型还是应用空间误差模型。绝对β趋同回归模型的表达式为式(1-12):
其中,代表第j个区域组内的任一区域i在T年份的人均产出,代表第j个区域组内的任一区域i在初始年份的人均产出,αj、βj为待估参数,其中,,可以根据此式计算趋同速度λj,为随机扰动误差项。当回归得到的βj在统计上显著为负时,那么该区域组内各区域之间就存在截面型俱乐部趋同,这些区域就构成了一个截面型趋同俱乐部。
3.空间趋同俱乐部影响因子筛选方法
根据空间趋同俱乐部形成的初始条件和结构特征,本研究把空间趋同俱乐部的影响因子分成了地方因子和具有地方效应的全局因子,按照这两种影响因子,构建中原经济区空间趋同俱乐部的影响因子框架,而后将这些经过分类的影响因子一并引入构建的空间趋同俱乐部影响因子筛选模型中进行回归计算,根据回归计算的结果,把显著的影响因子逐一挑选出来,即完成了中原经济区空间趋同俱乐部影响因子筛选。
以往的研究文献对空间趋同俱乐部影响因子的筛选,多采用截面回归模型,由于这类模型受到自由度的制约,可以引入的控制变量有限,而又无法引入影响稳态水平的那些难以观测的背景变量,当这些背景变量与解释变量相关时,若遗漏了就可能使得估计值偏离,以致得出错误的结论。空间面板数据模型在一定程度上提供了控制背景变量的方法,这一方法对于区域趋同研究以及趋同俱乐部影响因子的筛选应该是更为合适模型(Islam, 1995)。尽管已有一些学者对我国的区域经济增长差异进行了经验性研究,使用了空间面板数据方法,但均没有考虑研究区域的空间相关性问题。实际上,知识扩散、国内贸易、要素流动、技术以及其它意义上的空间溢出,使得区域经济增长存在空间相互作用,由于分析中使用的是基于行政区划的空间数据,可是行政区划边界与实际功能区边界在事实上往往表现为不一致,使得相邻行政区的测量误差发生联系(Anselin, 2000)。因此,利用面板数据模型做空间趋同俱乐部影响因子的筛选仍然还有不完善的地方,仍然可能造成影响因子的遗漏。
事实上,研究区域的经济增长及其趋同的因素是复杂的。因此,在研究其影响因子时,应把时间因素和空间因素纳入到统一的框架中去,不仅要研究区域经济增长的空间和时间的异质性,同时还要引入空间相关性。满足上述条件的影响因子筛选模型,只有空间面板数据模型。EIhorst在传统的面板数据模型中引入了空间滞后误差项或空间滞后被解释变量,从而明确地考虑了空间相关性,引入空间滞后项的传统面板模型称为固定效应的空间滞后模型,引入空间误差项的传统面板模型称为固定效应的空间误差模型。模型中控制了两类非观测效应即空间固定效应和时间固定效应,空间固定效应反映随区位变化,但不随时间变化的背景变量(如自然资源禀赋、自然环境等)对空间俱乐部趋同的影响;时间固定效应代表随时间变化,但不随区位条件变化的背景变化(如暂时性冲击、商业周期等)对空间俱乐部趋同的影响。下面是模型的矩阵表述:
设研究区域共有N个地区,T个时期,K个解释变量,第t期的观测值如下:
式中yt为第t期N个地区的人均GDP增长率列向量、Xt为第t期k个测度影响因子的解释变量的观测值矩阵,第一个解释变量X1为初期人均收入,εt为t期的误差项,假设εt服从经典线性回归模型的假设。则不同时期的数据叠加后形式如下:
对应于每一个观测值的空间和时间固定效应列向量如下:
上式中iT和iN为T维和N维元素全为1的列向量,设矩阵C如下:
上式中,C为NT×NT的方块对角矩阵,IT为T×T的单位矩阵,W是N×N的空间权重矩阵。在传统的固定效应模型中,分别引入空间滞后被解释变量及空间滞后误差项,即可以得到以下两种空间固定效应模型:
上式中,模型(1-13)为固定效应的空间滞后模型,模型(1-14)为固定效应的空间误差模型。β为解释变量系数的k维列向量,λ和ρ为空间滞后项的系数,μ为误差项,服从空间一阶自回归过程。这两个模型所反映的空间相关性均是全局性的,研究区域内任何两个区域之间都存在相关性,并且其相关强度服从距离衰减规律,固定效应的空间滞后模型意味着研究区域内任何一个区域经济增长的所有解释变量都会通过空间传导机制作用于其它区域;而固定效应的空间误差模型则是反映空间外溢是随机冲击作用的结果。因此,模型(1-13)和模型(1-14)不仅考虑了区域经济增长的时间和空间的异质性,而且还把空间相关性明确引入了趋同模型中,这在很大程度上纠正了模型的误设问题,而且还可以考察研究区域的空间外溢情况。
空间相关性检验是空间计量经济分析的一个重要组成部分,Moran's I(Maron,1948)、LMlag(Anselin, 1988b)、LMerr(Burridge, 1980)、Robust LMlag和Robust LMerr(Anselin, 1988b)等空间相关性检验(1)均不能直接用于空间面板数据模型,都是针对空间截面数据模型提出的。本研究应用方块对角矩阵C代替Moran's I等统计公式中的空间权重矩阵,这样就可以很方便的把这些检验扩展到面板数据分析。最小二乘法不适合用来估计空间计量经济模型,因为在模型包含空间滞后误差项的情况下,尽管OLS估计量是无偏的,但是,其估计值已不再有效;当模型包含有空间滞后的被解释变量的情况下,OLS估计量不仅是有偏的而且是非一致的。
LMerr和LMlag及其稳健形式的空间相关性检验,既可以用来检验空间相关性,还可以为模型的选定提供线索(Anselin&Rey, 1991; Anselin&Florax, 1995),帮助了本研究在模型(1-13)和模型(1-14)之间进行选择。目前通常的做法是首先进行OLS方法估计,不考虑空间相关性的受约束模型,而后进行空间相关性检验。若LMlag(或LMerr)比LMerr(或LMlag)的统计值更为显著,那么,应该选择的模型就是固定效应的空间滞后模型(1-13),否则就为固定效应的空间误差模型(1-14)。Rey和Montouri(1997)利用蒙特卡罗试验方法证明,此方法能够为空间计量经济模型的选择提供有益的启示。
依据上述检验出的存在空间趋同现象的区域组(空间趋同俱乐部)为对象,将各空间趋同俱乐部影响因子解释变量,视情况代入固定效应的空间滞后模型(式1-13)或固定效应的空间误差模型(式1-14),检验各解释变量对空间趋同俱乐部的影响是否显著,把影响效果显著的解释变量所测度的影响因子挑选出来,即完成了空间俱乐部趋同影响因子的筛选。
4.空间俱乐部趋同影响因子检验方法
把由固定效应的空间滞后模型(1-13)和固定效应的空间误差模型(1-14)筛选出的影响因子,借助对β趋同回归模型,采取逐步引入变量的方法,分析上述筛选出的各影响因子对空间趋同俱乐部影响的作用程度,用于验证所提出的关于空间趋同俱乐部影响因子的假设。
β趋同回归模型为:
式中yi=log(GDP)Ti-log(GDP)ti是研究时段内i区的GDP增长率,(GDP)ti是i区域人均GDP的初始水平,(GDP)Ti是i区域人均GDP的期末水平,Χji是i区域在初期的第j个指标,j=1,2,……,m(是经过筛选的影响因子),γj为回归系数。Dk(k=1、2……n-1,n表示区域组的个数)为区域组的归属虚拟变量,属于第k个区域组的区域有Dk=1,其他区域为0,εi是随机误差项。
在模型(1-15)中逐步引入由固定效应的空间滞后模型(1-13)和固定效应的空间误差模型(1-14)筛选出的影响因子,显著的影响因子保留下来,同时剔除不显著的影响因子,这样就会得出一个回归分析结果,从回归分析的结果可以看出哪些影响因子顺利通过了检验,这些顺利通过检验的影响因子就是该空间趋同俱乐部的影响因子。
通过上述影响因子的初步检验,本研究还无法判定已经顺利通过检验的影响因子对各空间俱乐部趋同作用程度的大小,以及在这些已经通过检验的影响因子中,哪些是重要影响因子、哪些是比较重要的影响因子、又有哪些影响因子是一般影响因子,为此,本研究将借助固定效应的空间滞后模型(式1-13)对经过筛选的影响因子进行主成分分析。
经过对空间趋同俱乐部的影响因子的双重检验,本研究就得到了影响各空间趋同俱乐部的重要影响因子、比较重要的影响因子和一般影响因子,以及这些影响因子对各空间俱乐部趋同的作用程度。根据影响各空间趋同俱乐部的主要因子就可以为政府部门提供促进区域经济协调发展,缩小区域经济发展差距提出具体实施的依据。
5.空间趋同俱乐部形成和演进机制研究方法
空间趋同俱乐部的形成和演进机制,主要是依据研究时段内不同年份不同空间趋同俱乐部成员数量的增减以及俱乐部成员的分布范围变化,依据空间滞后模型、空间误差模型和空间截面模型对空间俱乐部趋同检验的结果,从中发现不同空间趋同俱乐部的依赖模式以及空间溢出效应,观察空间溢出效应的表现形式是全局的还是局部的,如果空间溢出效应表现出既有全局溢出效应,同时又存在局部溢出效应,此时,就要考察全局溢出效应值和局部溢出效应值的大小,若全局溢出效应大于局部溢出效应,则在该分组内不会形成空间趋同俱乐部,只会存在空间上的集聚效应;若局部溢出效应大于全局溢出效应,就会在局部地区形成空间趋同俱乐部。
(三)研究的技术路线
本研究除遵循传统的趋同理论外,还依据研究区域的空间相互作用,运用经济地理学的经济空间组织理论、区域发展理论以及空间计量分析方法,并尝试将新古典经济增长理论、新增长理论以及新经济地理学的有关理论进行综合集成,对本研究所涉及的问题进行研究。基于此,本研究的技术路线如图1-1:
图1-1 研究的技术路线
(1) LMerr和LMlag是两个拉格朗日乘数检验,主要用于检验空间误差自相关和空间滞后自相关。