工程科学与技术   2022, Vol. 54 Issue (2): 113-121
基于信息熵理论的黄土高原小流域雨量站网优化
丁文峰1,2, 韩昊宇1,2,3, 王协康4, 郭宜薇1,2, 王一然1,2     
1. 长江水利委员会 长江科学院,湖北 武汉 430010;
2. 水利部 山洪地质灾害防治工程技术研究中心,湖北 武汉 430010;
3. 长江勘测规划设计有限责任公司,湖北 武汉 430010;
4. 四川大学 水力学与山区河流开发保护国家重点实验室,四川 成都 610065
基金项目: 国家重点研发计划项目(2019YFC1510705–05;2017YFC1502500);长江科学院科研院所基本科研业务费(CKSF2019185/TB)
摘要: 地面雨量站是降水数据最直接的来源,合理的雨量站点密度与空间布局能准确反映流域面雨量,对于构建流域水文模型至关重要。以黄土高原岔巴沟流域为研究对象,采用2001—2010年流域内11个地面雨量站的日、周、15 d时间尺度降雨量序列,以信息熵理论为基础,基于最大信息最小冗余准则(MIMR),分析11个地面雨量站之间降雨的信息相互关系和信息传递规律,并结合流域多年降雨时空分布特征,对岔巴沟流域雨量站网进行优化。结果表明:岔巴沟流域降雨量在2001—2010年间无明显变化趋势,降雨空间分布呈由西南到东北递减趋势;不同时间尺度降雨序列的联合熵、互信息、冗余信息变化总体相同;总体信息随站点增多趋向稳定,站点之间传递的信息越来越少,冗余信息越来越多;另外,随着时间尺度变大,联合熵稳定越快,冗余信息越多。依据流域雨量站点间信息熵变化规律,对岔巴沟流域雨量站网进行了优化,确定不同时间尺度下的流域最佳雨量站密度和分布,优化后的流域雨量站网能较好的反映流域降雨信息。研究结果可为今后流域雨量站网的优化布局提供理论依据。
关键词: 信息熵理论    雨量站网优化    最大信息最小冗余准则    岔巴沟小流域    
Rainfall Networks Optimization in Small Catchment of Loess Plateau Based on Information Entropy
DING Wenfeng1,2, HAN Haoyu1,2,3, WANG Xiekang4, GUO Yiwei1,2, WANG Yiran1,2     
1. Changjiang River Scientific Research Inst. of Changjiang Water Resources Commission, Wuhan 430010, China;
2. Research Center on Mountain Torrent Geological Disaster Prevention of Ministry of Water Resources, Wuhan 430010, China;
3. Changjiang Survey, Planning, Design and Research Co., Ltd., Wuhan 430010, China;
4. State Key Lab. of Hydraulics and Mountain River Eng., Sichuan Univ., Chengdu 610065, China
Abstract: Precipitation information is mainly collected by ground monitoring networks. Rainfall stations contain the fundamental input for planning, design, operation, and management of water resources systems. Reasonable rainfall gauges, which are effective and efficient in gathering precipitation information have received considerable attention. In order to analyze the relationship between rainfall information of 11 ground rainfall stations in Chabagou small catchment of the Loess Plateau, precipitation series from 2001 to 2010 were organized into appropriate sampling intervals (1-day, weekly, 15-days). Based on the information entropy theory and Maximum Information Minimum Redundancy criterion (MIMR), with the use of the spatial and temporal distribution characteristics of multi-year average precipitation, the existing rainfall station network in Chabagou catchment were evaluated and optimized. The results show that the rainfall in Chabagou catchment did not change significantly during the study period, and the rainfall showed a decreasing trend from southwest to northeast from 2001 to 2010. The changes of the joint entropy, the mutual joint information and the redundant information of rainfall series at different time scales were generally the same, and the joint information tended to be stable with the increase of stations. While the information transmitted between stations was less and less, the redundant information was more and more. With the increase of time scales, the joint entropy became more stable quickly and the redundant information became more. According to the variation of information entropy among rainfall stations in the Chabagou catchment, the rainfall station network was optimized, and the optimal density and distribution of rainfall stations in catchment at different time scales were determined. The optimized rainfall station network can reflect the rainfall information in the basin. The research results can provide a theoretical basis for the optimal layout of rainfall station network in the future.
Key words: information entropy    optimization of rainfall networks    maximum information minimum redundancy criterion    Chabagou catchment    

准确获取降雨数据对流域水文过程模拟和水资源管理有重要意义。目前从获取流域降雨信息的技术手段看,主要有两种,一是基于地面雨量站网的降雨量监测,二是基于雷达卫星的遥感测量。遥感手段获取的网格降雨数据在捕捉降雨的时空变异性上优于传统地面雨量站网,但在使用时仍然需要地面雨量站网数据对其进行校准和评价[1-2]。此外,由于其空间分辨率普遍较低,在小流域降雨数据获取方面并不理想。传统地面雨量站网不仅能直接观测点降雨量且观测精度较高,但受流域地形等多种因素的影响,地面雨量站网的布设密度和空间布局等对流域面雨量影响很大,如何科学布设地面雨量站网一直是水文气象研究领域关注的重要问题。Mishra和Coulibaly[3]比较了多种水文站网设计方法,包括统计方法、空间插值方法、基于流域地理特征方法、用户调查方法、混合方法和基于熵的水文站网设计方法,并指出基于信息熵的雨量站网设计是最具前景的方法。Krstanovic和Singh[4]将信息熵应用于雨量站网设计,基于最大熵准则(POME)将降雨数据进行正态化处理并计算密度函数,对路易斯安那州的地面雨量监测站网进行了评估。由于降雨等自然现象是重尾分布,假设数据为正态分布计算信息熵具有争议性。Vicente等[5]发现边际熵与巴西北部的总降水量有很好的相关性,降雨量较高的地区,概率分布往往更均匀。但是以上研究都是在单一判别准则的基础上通过添加或减少站点的方法来实现雨量站点的优化,而水文监测站点的最佳选址是一个多目标问题。Alfonso等[6]通过最大化多元联合熵和最小化总相关性来优化水位监测站网,结合遗传算法来逼近多目标优化。多目标优化的优点是在不同的情况下提供不同的可行解,然而,监测站网的选择与确定十分复杂,为了解决假设分布的争议,Li和Singh[7]在计算信息熵时,使用数据离散化处理降雨数据,并提出了最大信息最小冗余准则(maximum information minimum redundancy,MIMR),将多目标问题转为单目标问题,避免了多目标优化的复杂性,又保留了通过权重获得不同可行解的优势。

根据水文站网规划技术导则[8],国内的雨量站网规划与优化主要采取雨量站网密度分析方法中的抽站法和流域水文模型法,精度评价时大都采用流域面雨量精度作为雨量站网规划和优化的目标函数[9-11],且多针对大中尺度流域,而针对小流域尺度地面雨量站点的监测布局缺乏相关研究。黄土高原位于中国干旱半干旱区,水资源缺乏,降雨比较集中且分布极不均匀,如何科学布设地面雨量站点,准确获取流域降雨信息不仅对水资源优化利用有重要意义,而且对流域水文循环和水文模型研究也具有重要科学意义。岔巴沟流域位于黄土高原丘陵沟壑区第一副区,多年来,由于科研生产实践的需要,流域内布设有11个雨量站,雨量站点密度远大于水文站网规划技术导则中的相关要求,为评估和优化黄土高原小流域地面雨量站网提供了研究对象。因此,以岔巴沟流域为例,基于信息熵理论,使用不同时间尺度的降雨序列评估岔巴沟流域的雨量站网的合理性,并对其进行优化,以期为今后黄土高原小流域雨量站网布设提供依据。

1 材料与方法 1.1 研究区概况与数据来源

岔巴沟是无定河的二级支流,大理河的一级支流。地处东经109°47′,北纬37°31′,属于黄土高原丘陵沟壑区的第一副区。岔巴沟流域面积205 km2,海拔高度900~1 100 m[12-13]。流域出口曹坪站以上集水面积187 km2,属半干旱区,为温带大陆性季风气候,干燥少雨,降雨年内分配不均,大部分集中于6—9月,且多是高强度短历时暴雨[14-15]

本文选取岔巴沟流域11个雨量站点的降雨数据,站点分布如图1表1所示。

图1 研究区域及雨量站位置 Fig. 1 Research area and the location of rainfall stations

表1 流域站点名称及位置 Tab. 1 Name and location of rainfall stations

研究时间为2001—2010年中每年5—10月,该数据来自于《黄河流域水文年鉴》。由于汛期降水为该流域降水量的主要来源,本文使用汛期降雨量来代替年降雨量。

1.2 研究方法

Shannon[16]在1984年提出了信息熵理论,基于概率计算得到了随机变量的不确定性程度,即随机变量包含的信息量,从而解决了对信息的量化问题。在水文气象、水文和水资源中,常用的基本信息度量指标包括边缘信息熵、条件信息熵、联合信息熵、互信息和冗余信息熵。本研究基于这些指标首先对岔巴沟流域11个雨量站点间的信息进行信息熵计算,分析他们之间信息的相互关系和信息传递规律等,然后根据信息阈值及统计学方法进行站网的优化布局。

1)边缘信息熵

假设某一随机变量Xn个可能取值xii=1,2,3 $, \cdots $ ,n)发生概率为 ${p_1},{p_2},{p_3}, \cdots ,{p_n} $ ,边缘信息熵定义为:

$ H(X)=-k{\displaystyle \sum _{i=1}^{n}p({x}_{i}){\mathrm{log}}_{b}p}({x}_{i}) $ (1)

式中:k为任意正常数,取k=1;底数b取不同值时信息熵的量纲不同,当b=2时,其量纲为bit(比特,即Binary Digit),当b=e(自然对数底)时,其量纲为nat(纳特,Natural Digit),当b=10时,其量纲为dit(迪特,Decimal Digit),本文中b取2[7]

边缘信息熵描述了随机变量X的离散程度和不确定性程度,其离散程度越高相应的不确定性越大。

2)联合信息熵

对于多维随机变量,联合信息熵被定义为随机变量保留的总体信息的度量。以2维随机变量(X,Y)为例,其联合信息熵的计算公式为:

$ H(X\text{,}Y)=-{\displaystyle \sum _{i=1}^{n}p({x}_{i}\text{,}{y}_{j}){\mathrm{lb}}p}({x}_{i}\text{,}{y}_{j}) $ (2)

式中,p(xi,yi) 为2维随机变量(X,Y)的联合分布概率[16]

在两个随机变量上进行延伸,可得多维随机变量所保留的总体信息。多维联合信息熵定义为:

$ \begin{aligned}[b]H({X}_{1}\text{,}&{X}_{2}\text{,}\cdots \text{,}{X}_{n})\text=-\\& {\displaystyle \sum _{{x}_{1}}{\displaystyle \sum _{{x}_{2}}\cdots{\displaystyle \sum _{{x}_{n}}p}}}({x}_{1},{x}_{2},\cdots,{x}_{n}){\mathrm{lb}}p({x}_{1},{x}_{2},\cdots,{x}_{n})\end{aligned} $ (3)

3)互信息

2维随机变量(XY),由Y(X)推导出X(Y)的信息,定义为:

$ T(X\text{,}Y)\text= -{\displaystyle \sum _{x}{\displaystyle \sum _{y}p({x}_{i}\text{,}{y}_{j})}}{\mathrm{lb}}\dfrac{p({x}_{i}\text{,}{y}_{j})}{p({x}_{i}\text{)}p\text{(}{y}_{j})} $ (4)

T(XY)为2维随机变量(XY)间的互信息。将式(4)展开化简可得:

$ T(X{\text{,}}Y) = H(X) + H(Y) - H(X,Y) $ (5)

由式(5)可知,互信息描述了2个随机变量之间共有的信息量,其值的大小反应了随机变量之间的相关性大小。它优于皮尔逊相关系数,因为它捕获了线性和非线性依赖关系,而皮尔逊相关系数仅适用于线性关系[7]

4)总相关

总相关描述多维随机变量之间的信息冗余,即度量随机变量之间的重复信息量[2]。总相关的定义为:

$ C({X}_{1}\text{,}{X}_{2}\text{,}\cdots\text{,}{X}_{n})\text= -{\displaystyle \sum _{i=1}^{n}H({X}_{i})}-H({X}_{1}\text{,}{X}_{2},\cdots{X}_{n}) $ (6)

式中,C(X1, X2 $,\cdots $ Xn)为随机变量X1, X2 $,\cdots $ ,Xn间的重复信息量。

1.3 数据处理方法

熵的定义中包含了概率分布,因此计算概率分布成为信息熵计算的关键。概率分布估计方法主要分为两类:1)基于概率分布函数(probability distribution function,pdf)的拟合及其参数估算;2)非参数密度估计。对于pdf估计中,正态分布作为典型分布得到了广泛的应用[6,17]。然而,自然界中流量、降雨等自然现象都是重尾分布[18],分布选择的不合适,概率分布的计算就会不准确,在非参数密度估计中则避免了这一误差。非参数估计方法主要包括直方图法、数学地板函数法。由于在水文站网设计下的信息熵计算,不需要精确量化的信息保留状态,只要能在信息内容上保持站点之间的相对关系,这个近似估计就是合理的。因此,本研究采用数学地板函数法对数据进行离散化,其表达式为:

$ {X_{\rm{q}}} = a\left\lfloor {\dfrac{{2x + a}}{{2a}}} \right\rfloor $ (7)

式中,x为随机变量X的原始取值,Xq为数据序列的离散值,a为可调整的因子, $\left\lfloor {\cdot} \right\rfloor $ 表示取整函数。该方法是与a相关的舍入法,a的大小与随机变量的种类不同而变化。例如:对径流数据进行离散化时,a=150[18];对降雨、水位和流量数据进行离散化时,a通常可取1、3或5[19-23];在本文中,取a=3。

多维随机变量通过数学地板函数转换成离散变量后,可以利用离散变量分组性质来计算联合信息熵。Li等[18]对Alfonso等[6]提出的融合方法进行了改进,将多维离散随机变量的联合信息熵融合为1维离散随机变量的信息熵,用式(2)进行计算,可得多维离散随机变量的联合信息熵。以2维离散型随机变量为例,X1=[1,2,1,2,1,3,3],X2=[1,2,2,2,1,3,2],融合得到新的变量X= $\langle $ X1, X2 $\rangle $ =[11,22,12,22,11,33,32],其中 $\langle $ · $\rangle $ 表示变量融合。将X中的可能取值的不同值按大小排列并取排列后取值对应的位置索引代替X中的可能取值,得到新的X=[1,3,2,3,1,3,4]。利用式(1)和(2)进行验证,可知H(X)=H(X1,X2),即合并前后的信息量保持不变。

多维离散型随机变量的联合信息熵表示为[18]

$ \begin{aligned}[b] H({X_1}{\text{,}} &{X_2},\cdots,{X_n}){\text{ = }} \hfill \\& H( \langle {X_1}{\text{,}}{X_2} \rangle ,{X_3},\cdots,{X_n}) {\text{ = }}\hfill \\& H( \langle \langle {X_1}{\text{,}}{X_2} \rangle ,{X_3} \rangle ,\cdots,{X_n})= \hfill \\& H( \langle \cdots \langle \langle {X_1}{\text{,}}{X_2} \rangle ,{X_3} \rangle ,\cdots{X_{n - 1}} \rangle ,{X_n})= \hfill \\& \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\cdots\cdots \hfill \\& H( \langle \cdots \langle \cdots \langle \langle {X_1}{\text{,}}{X_2} \rangle ,{X_3} \rangle , \cdots{X_{n - 1}} \rangle ,{X_n} \rangle ) \hfill \\ \end{aligned} $ (8)

总相关可用式(6)计算,也可以利用变量分组性质和变量合并来进行计算,其公式为[18]

$ \begin{aligned}[b] C({X_1}{\text{,}}&{X_2},\cdots,{X_n}) =\hfill \\& C({X_1}{\text{,}}{X_2}) + C( \langle {X_1}{\text{,}}{X_2} \rangle ,{X_3},{X_4},\cdots,{X_n})= \hfill \\& C({X_1}{\text{,}}{X_2}) + C( \langle {X_1}{\text{,}}{X_2} \rangle ,{X_3}) + \hfill \\& C( \langle {X_1}{\text{,}}{X_2},{X_3} \rangle ,{X_4},{X_5},\cdots,{X_n})= \hfill \\& \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\cdots\cdots \hfill \\& C({X_1}{\text{,}}{X_2}) + C( \langle {X_1}{\text{,}}{X_2} \rangle ,{X_3}) + \hfill \\& C( \langle {X_1}{\text{,}}{X_2},{X_3} \rangle ,{X_4}) + \cdots+ \hfill \\& C( \langle {X_1}{\text{,}}{X_2},{X_3},\cdots,{X_{n - 1}} \rangle ,{X_n}) \hfill \\ \end{aligned} $ (9)

借助分组性质和变量合并,互信息可用以度量两组变量之间的共同信息,定义为 $T( { \langle {X_1},{X_2},\cdots,{X_n} \rangle },$ ${\langle X_1',X_2',\cdots,X_n' \rangle } )$

1.4 雨量站网络优化算法

Li[7]为解决水文站网优化问题提出了最大信息最小冗余MIMR算法,使用该算法,可对水文网络站点的重要性进行排序,使得所选站点集有最大化整体信息、最大信息转移能力和最小化冗余信息。

假设共有N个站点,Sk表示已选入最优网络的k个站点,Fm表示待选的m个站点,k+m=N,则优化算法的信息熵公式表示为:

$ \left\{ \begin{gathered} {\rm{Max}}.H({X_{{S_1}}}{\text{,}}{X_{{S_{_2}}}},\cdots,{X_{{S_k}}}), \hfill \\ {\rm{Max}}.T( \langle {X_{{S_1}}}{\text{,}}{X_{{S_{_2}}}},\cdots,{X_{{S_k}}} \rangle , \langle {X_{{F_1}}}{\text{,}}{X_{{F_2}}},\cdots,{X_{{F_m}}} \rangle ), \hfill \\ {\rm{Min}}.C({X_{{S_1}}}{\text{,}}{X_{{S_{_2}}}},\cdots,{X_{{S_k}}}) \hfill \\ \end{gathered} \right. $ (10)

为了规避多目标优化的复杂性,方便计算站点的重要性,将多目标问题转为单目标问题:

$ \begin{aligned}[b] {\rm{Max}}.\;&{\lambda _{\text{1}}}(H({X_{{S_1}}}{\text{,}}{X_{{S_{_2}}}},\cdots,{X_{{S_k}}}) + \hfill \\& T( \langle {X_{{S_1}}}{\text{,}}{X_{{S_{_2}}}},\cdots,{X_{{S_k}}} \rangle , \langle {X_{{F_1}}}{\text{,}}{X_{{F_2}}},...,{X_{{F_m}}} \rangle )) - \hfill \\& {\lambda _{\text{2}}}C({X_{{S_1}}}{\text{,}}{X_{{S_{_2}}}},\cdots,{X_{{S_k}}}) \hfill \\[-2pt] \end{aligned} $ (11)

式中,λ1、λ2为权重,两者之和为1。

为了解决雨量站网优化问题,Li等[7]推广了MIMR算法。首先,设置联合信息熵的阈值,计算各站点的边缘信息熵,选择边缘信息熵最大的站点为中心站点;再使用MIMR算法对站点进行排序,当达到阈值时,得到水文网络站点的优化最终决策。用公式表示为:

$ \eta \ge \frac{{H({X_{{S_1}}}{\text{,}}{X_{{S_{_2}}}},\cdots,{X_{{S_k}}})}}{{H({X_{{S_1}}}{\text{,}}{X_{{S_{_2}}}},\cdots,{X_{{S_k}}},{X_{{F_1}}}{\text{,}}{X_{{F_{_2}}}},\cdots,{X_{{F_m}}})}} $ (12)

式中,η为阈值,当η≥95%时,即得到了水文站网的优化最终决策。

1.5 统计方法

使用泰森多边形计算11个雨量站的流域年均降雨量作为参考数据,评估雨量站网优化设计的可靠性。采用了3种统计指标,相关系数r、相对偏差RBS、纳西效率系数NS[24-25]

$ r = \dfrac{{\displaystyle\sum\limits_{i = 1}^n {({x_{{\rm{ref}},i}} - x_{{\rm{ref}}}')({x_{{\rm{inv}},i}} - x_{{\rm{inv}}}')} }}{{\sqrt {\displaystyle\sum\limits_{i = 1}^n {{{({x_{{\rm{ref}},i}} - x_{{\rm{ref}}}')}^2}} \displaystyle\sum\limits_{i = 1}^n {{{({x_{{\rm{inv}},i}} - x_{{\rm{inv}}}')}^2}} } }} $ (13)
$ {\rm{RBS}} = \dfrac{{\displaystyle\sum\limits_{i = 1}^n {{x_{{\rm{ref}},i}}} - \displaystyle\sum\limits_{i = 1}^n {{x_{{\rm{inv}},i}}} }}{{\displaystyle\sum\limits_{i = 1}^n {{x_{{\rm{ref}},i}}} }} $ (14)
$ {\rm{NS}} = 1 - \dfrac{{\displaystyle\sum\limits_{i = 1}^n {({x_{{\rm{inv}},i}} - {x_{{\rm{ref}},i}}} {)^2}}}{{\displaystyle\sum\limits_{i = 1}^n {({x_{{\rm{inv}},i}} - x_{{\rm{ref}}}'} {)^2}}} $ (15)

式中:xref为11个雨量站的流域年降雨量;xinv为雨量站网络优化后的流域年降雨量;n为研究期间时段总数,取值为2001, 2002 $,\cdots $ , 2010;i表示第i个时段; $ x_{{\rm{ref}}}' $ $ x_{{\rm{inv}}}' $ 分别表示优化前和优化后的降雨年平均值。

2 结果分析 2.1 岔巴沟流域降雨量时空变化分析

根据2001—2010年岔巴沟流域实测降雨资料,采用泰森多边形方法计算流域多年降雨量和流域汛期的多年平均月降雨量,年降雨量和汛期各月降雨量,见图2。从图2(a)可以看出,流域近10 a降雨量无明显变化趋势,其中,2009年降雨量最大(545 mm),2008年降雨量最小(355 mm)。月平均降雨量如图2(b)所示,流域多年汛期月平均降雨量分别为42.40、58.70、89.30、145.24、92.80、33.40 mm,其中,8月降雨量最大,5月和10月降雨量较小,7、8、9这3个月占汛期总降雨量的71%。

图2 流域年降雨量及汛期月平均降雨量 Fig. 2 Annual rainfall and flood season month average rainfall

根据11个雨量站的实测降雨资料,统计2001—2010年流域平均年降雨量空间分布。采用样条函数法进行空间插值计算岔巴沟流域降雨量的空间变化见图3。从图3可以看出:岔巴沟流域西南部海拔较高,处于西南部的王家墕、和民墕降雨较多;东北部海拔较低,处于东北部的杜家山、姬家岺降雨较少。总的来说,流域汛期多年平均降雨量呈现西南到东北递减趋势。

图3 年平均降雨量空间分布 Fig. 3 Spatial distribution of average annual rainfall

对岔巴沟2001—2010年降雨资料进行统计,得到各雨量站暴雨场次及年均暴雨量(表2)。从表2可以看出:万家墕、王家墕、牛薛沟3个站点监测到11场暴雨;马虎墕监测到的暴雨场次最少(8场),且年均暴雨量较少,为79.3 mm;其他各站点年均暴雨量无明显差异,岔巴沟流域内暴雨分布较均匀。

表2 2001—2010年暴雨场次及年均暴雨量 Tab. 2 Number of rainstorm events and average annual rainfall from 2001 to 2010

2.2 岔巴沟流域降雨信息熵

为了计算不同时间尺度下的岔巴沟流域雨量站网信息熵,使用不同时间间隔对日降雨量进行采样,分别得到日、周、15 d时间尺度的降雨序列。

根据式(11)可知,权重λ1λ2对流域雨量站网信息熵有重要影响。对权重λ1λ2进行敏感性分析,发现权重λ1在0.5到1.0变化(λ2从0.5到0变化)时,雨量站网始终保持信息的稳定,因此本研究中取λ1=0.8,λ2=0.2。

对连续的降雨序列使用式(7)进行离散化处理后,使用MIMR准则,联合信息熵、互信息和总相关为雨量站的选取提供依据(表3)。日、周、15 d时间尺度的降雨序列,中心站点分别为站点7、站点1、站点10。由年降雨量分布图3中可知,站点7、1、10的年均降雨量都较大,MIMR准则会选择年均降雨量较大的站点为中心站点。

表3 不同时间尺度降雨序列联合信息熵H、互信息T和总相关C迭代计算 Tab. 3 Joint Entropy H, Transinformation T, and Total Correlation C of rainfall 1-day,weekly and 15 days series

通过式(3)、(5)和(6)计算得出,不同时间尺度降雨序列的H、T、C随着迭代次数的变化,如图4所示。图4反映了H、T、C随着迭代次数的变化,联合熵随站点增多逐渐变大,并逐渐趋向稳定,即总体信息量趋向稳定。不同时间尺度的联合熵达到稳定的迭代次数不同,日尺度在9次,周尺度在7次,月尺度在5次,时间尺度越大,稳定得越快。互信息先随站点增多而增大,在联合熵达到稳定后有减小的趋势,说明联合熵稳定后,站点之间的信息传递越来越少,站点之间的冗余信息越来越多。

图4 不同时间尺度各站点降雨序列的联合熵H、互信息T、总相关C随迭代次数变化趋势 Fig. 4 Variation of each station rainfall sequence Joint Entropy H, Transinformation T, and Total Correlation C under different time scales

通过式(12)计算得出各站点联合信息熵的阈值,见图5。不同时间尺度的雨量站网雨量信息在迭代一定次数后,趋势稳定。日时间尺度的雨量站点排序为7、10、1、3、11、4、9、5、6、2、8;在迭代8次之后,阈值达到了95.8%,即8个站点的雨量信息即可反映流域95.8%的雨量信息,这8个站可作为优化后的雨量站网。周时间尺度的站点排序为1、7、11、10、3、5、6、4、9、8、2;在迭代5次后,阈值达到95.1%,即5个站点的雨量信息即可反映流域95.1%的雨量信息,这5个站可作为优化后的雨量站网。15 d时间尺度的站点排序为10、1、4、11、9、5、3、7、6、8、2,在迭代3次后,阈值达到97.9%,即3个站点的雨量信息即可反映流域97.9%的雨量信息,这3个站可作为优化后的雨量站网。结合联合熵、互信息、冗余信息的计算进行分析,在用周、15 d时间尺度对降雨量进行采样后,降雨量出现重复信息较多的现象,使得冗余信息出现了较大增长。在计算阈值时,较大的时间尺度会在迭代次数较少的时候出现稳定的状态,但通过站点排序,不同时间尺度中,站点8、2一直排在最后两位。8号站点可能是因为其地理位置离站点5、10较近;站点1的在日时间尺度、周时间尺度中都是中心站点,在15 d时间尺度中是位于第2位;站点2位于末位的原因可能是其携带的信息与站点1有大量的重复信息。

图5 3种采样间隔的阈值计算 Fig. 5 Threshold calculation in three sampling intervals

2.3 岔巴沟流域雨量站点布局优化

根据日、周和15 d时间尺度降雨序列边缘熵、联合信息熵、互信息计算结果,对岔巴沟流域的雨量站网进行优化。日时间尺度降雨量站网的数量为8个,分别为1、7、11、10、3、5、6、4号站点,阈值达到了95.8%;周时间尺度降雨量站网的数量为5个,分别为1、5、6、7、11号站点,阈值达到了95.1%;15 d时间尺度降雨量站网的数量为3个,分别为1、5、11号站点,阈值达到了97.9%。通过MIMR准则,保留了降雨量较大的站点,站点1和民墕站以及流域出口站点11曹坪站;保留了降雨量较小的站点,站点5杜家山。优化后的雨量站网增大了这些站点的流域控制面积,另外,结合暴雨统计,也同时保留了监测暴雨场次较多的站点。

通过泰森多边形法计算了流域雨量站点优化前后的流域雨量(表4),利用式(13)~(15),计算了3个时间尺度下流域站点优化前后降雨量间的相关系数r、相对偏差(RBS)、纳西效率系数(NS)3个统计参数,见表5。总体来看,统计结果说明优化后雨量站网计算的流域平均降雨量与实测值间存在较好相关性。

表4 雨量站网优化前后流域年均降雨量 Tab. 4 Average annual rainfall in catchment before and after rainfall networks optimized

表5 不同时间尺度下流域站点优化前后降雨量间的3个统计参数 Tab. 5 Three statistical variables before and after rainfall networks optimized under the different time scales

为评估地面雨量站网优化前后流域降雨量的空间变异情况,根据优化前后地面雨量站点的平均日、周、15 d时间尺度的雨量信息,利用克里金插值方法,生成了流域日、周、15 d时间尺度的流域降雨量空间分布图(图6)。从图6中可以看出,优化前后日时间尺度流域降雨量空间分布状况基本一致,说明优化后的地面雨量站可以反映日时间尺度的降雨空间分异状况。而对于周和15 d时间尺度而言,随时间尺度的增大,流域降雨量的空间分布在优化前后变化较大,特别是15 d时间尺度,优化前后流域降雨量空间分布发生了明显改变,说明优化后的地面雨量站雨量信息并不能反映流域降雨量的空间分布。这主要是由于优化前地面雨量站点本就分布不均匀,经优化后,强化了这种雨量站点的空间不均匀性所致。

图6 雨量站网优化前后不同时间尺度流域降雨量空间分布 Fig. 6 Rainfall spatial distribution of different time scales before and after rainfall networks optimized in catchment

3 结 论

基于信息熵理论和MIMR准则,通过联合熵阈值计算,使用不同时间尺度的降雨序列对岔巴沟流域11个雨量站点组成的站网体系进行了评价和优化,结论如下:

1)不同时间尺度降雨序列的总体信息量随站点增多趋向稳定;互信息先增大后减小,站点之间的信息传递越来越少;站点之间的冗余信息随站点增加一直增大,站点之间的重复信息越来越多。另外,时间尺度越大,联合熵稳定的越快,冗余信息越多。

2) 3个时间尺度雨量站点优化前后的流域面均雨量变化不大,但在反映流域降雨量空间分布上,优化前后日时间尺度流域降雨量空间分布状况基本一致,而对于周和15 d时间尺度而言,随时间尺度的增大,流域降雨量的空间分布在优化前后变化较大,优化后的地面雨量站雨量信息并不能反映流域降雨量的空间分布。

3)以日、周和15 d时间尺度的流域雨量站网降雨序列信息熵值为优化雨量站网的依据,确定了不同时间尺度岔巴沟流域雨量站网最佳数量和分布,结果表明优化后的流域雨量站网能较好的反映流域降雨信息。

参考文献
[1]
Rana S,McGregor J,Remwick J,et al. Precipitation seasonality over the indian subcontinent:An evaluation of gauge,reanalyses,and satellite retrievals[J]. Journal of Hydrometeorology, 2015, 16(2): 631-651. DOI:10.1175/JHM-D-14-0106.1
[2]
Chen Aifang,Chen Deliang,Azorin–Molina,et al. Assessing reliability of precipitation data over the Mekong River basin:A comparison of ground-based,satellite,and reanalysis datasets[J]. International Journal of Climatology, 2018, 38(11): 4314-4334. DOI:10.1002/joc.5670
[3]
Mishra A K,Coulibaly P. Developments in hydrometric network design:A review[J]. Reviews of Geophysics, 2009, 47(2): RG2001. DOI:10.1029/2007RG000243
[4]
Krstanovic P F,Singh V P.Evaluation of rainfall networks using entropy:I. Theoretical development[J]. Water Resources Management, 1992, 6(4): 279-293. DOI:10.1007/BF00872281
[5]
de P Rodrigues da Silva V,Belo Filho A F,Singh V P,et al. Entropy theory for analysing water resources in northeastern region of Brazil[J]. Hydrological Sciences Journal, 2017, 62(7): 1029-1038. DOI:10.1080/02626667.2015.1099789
[6]
Alfonso L,Lobbrecht A,Price R. Optimization of water level monitoring network in polder systems using information theory[J]. Water Resources Research, 2010, 46(12): 595-612. DOI:10.1029/2009WR008953
[7]
Li Chao,Singh V P,Mishra A K. Entropy theory-based criterion for hydrometric network evaluation and design:Maximum information minimum redundancy[J]. Water Resources Research, 2012, 48: W05521. DOI:10.1029/2011wr011251
[8]
黄河水利委员会水文局.水文站网规划技术导则:SL 34—2013[S].北京:中国水利水电出版社,2013.
[9]
Wang Xiaozan,Zhao Yanzeng. The influence of rain gauge network placement on the estimates of rainfall of sub-basins[J]. China Rural Water and Hydropower, 2019(11): 10-14. [王小赞,赵彦增. 雨量站网布设对子流域降雨量计算结果的影响[J]. 中国农村水利水电, 2019(11): 10-14. DOI:10.3969/j.issn.1007-2284.2019.11.003]
[10]
Bayat B,Hosseini K,Nasseri M,et al. Challenge of rainfall network design considering spatial versus spatiotemporal variations[J]. Journal of Hydrology, 2019, 574: 990-1002. DOI:10.1016/j.jhydrol.2019.04.091
[11]
Aschonitis V G,Awe G O,Abegunrin T P,et al. Geographic segmentation,spatial dependencies,and evaluation of the relative position of rain gauges based on gridded data of mean monthly precipitation:Application in Nigeria[J]. Hydrology Research, 2018, 9(1): 107-122. DOI:10.2166/nh.2016.095
[12]
Zhang Letao,Li Zhanbin,Wang He,et al. Influence of intra-event-based flood regime on sediment flow behavior from a typical agro-catchment of the Chinese Loess Plateau[J]. Journal of Hydrology, 2016, 538: 71-81. DOI:10.1016/j.jhydrol.2016.01.061
[13]
Qi Junyu,Cai Qiangguo,Fang Haiyan,et al. Effects of soil and water conservation on reduction of runoff and sediment in Chabagou Watershed[J]. Science of Soil and Water Conservation, 2010, 8(1): 28-33. [綦俊谕,蔡强国,方海燕,等. 岔巴沟流域水土保持减水减沙作用[J]. 中国水土保持科学, 2010, 8(1): 28-33. DOI:10.3969/j.issn.1672-3007.2010.01.006]
[14]
Yang Jishan,Yao Wenyi,Zheng Mingguo,et al. Analysis on gravitational sediment yield in the check-dam controlled basins of Chagagou Watershed[J]. Journal of Hydraulic Engineering, 2017, 48(2): 241-245. [杨吉山,姚文艺,郑明国,等. 岔巴沟淤地坝小流域重力侵蚀产沙量分析[J]. 水利学报, 2017, 48(2): 241-245. DOI:10.13243/j.cnki.slxb.20160215]
[15]
Mo Shuhong,Gong Yao,Li Jie,et al. Impact of human activities on flood process in Chabagou basin of the loess plateau,China[J]. Journal of Basic Science and Engineering, 2019, 27(3): 492-508. [莫淑红,巩瑶,李洁,等. 人类活动对岔巴沟流域洪水过程影响研究[J]. 应用基础与工程科学报, 2019, 27(3): 492-508.]
[16]
Shannon C E. A mathematical theory of communication[J]. The Bell System Technical Journal, 1948, 27(3): 379-423. DOI:10.1002/j.1538-7305.1948.tb01338.x
[17]
Watanabe S. Information theoretical analysis of multivariate correlation[J]. IBM Journal of Research and Development, 1960, 4(1): 66-82.
[18]
Li Chao,Singh V P,Mishra A K. Simulation of the entire range of daily precipitation using a hybrid probability distribution[J]. Water Resources Research, 2012, 48(3): 1-17. DOI:10.1029/2011WR011446
[19]
Scott D W. On optimal and data-based histograms[J]. Biometrika, 1979, 66(3): 605-610. DOI:10.1093/biomet/66.3.605
[20]
Keum J,Coulibaly P. Information theory-based decision support system for integrated design of multivariable hydrometric networks[J]. Water Resources Research, 2017, 53(7): 6239-6259. DOI:10.1002/2016WR019981
[21]
Wang Wenqi,Wang Dong,Singh V P. Optimization of rainfall networks using information entropy and temporal variability analysis[J]. Journal of Hydrology, 2018, 559(2018): 136-155. DOI:10.1016/j.jhydrol.2018.02.010
[22]
Kraskov A,Stögbauer H,Andrzejak R G,et al. Hierarchical clustering using mutual information[J]. Europhysics Letters (EPL), 2005, 70(2): 278-284. DOI:10.1209/epl/i2004-10483-y
[23]
Chang C H,Wu S J,Hsu C T,et al. An evaluation framework for identifying the optimal raingauge network based on spatiotemporal variation in quantitative precipitation estimation[J]. Nordic Hydrology, 2017, 48(1/2): 77-98.
[24]
Nash J E,Sutcliffe J V. River flow forecasting through conceptual models part I–A discussion of principles-ScienceDirect[J]. Journal of Hydrology, 1970, 10(3): 282-290. DOI:10.1016/0022-1694(70)90255-6
[25]
Moriasi D N,Arnold J G,Liew M W V,et al. Model evaluation guidelines for systematic quantification of accuracy in watershed simulations[J]. Transactions of the ASABE, 2007, 50(3): 885-900. DOI:10.13031/2013.23153