大坝变形监控模型识别的R–OC准则

张博 刘健 吴震宇 陈建康 尹川

张博, 刘健, 吴震宇, 等. 大坝变形监控模型识别的R–OC准则 [J]. 工程科学与技术, 2023, 55(3): 175-185. doi: 10.15961/j.jsuese.202200135
引用本文: 张博, 刘健, 吴震宇, 等. 大坝变形监控模型识别的R–OC准则 [J]. 工程科学与技术, 2023, 55(3): 175-185. doi: 10.15961/j.jsuese.202200135
ZHANG Bo, LIU Jian, WU Zhenyu, et al. R–OC Criterion for Dam Deformation Monitoring Model Identification [J]. Advanced Engineering Sciences, 2023, 55(3): 175-185. doi: 10.15961/j.jsuese.202200135
Citation: ZHANG Bo, LIU Jian, WU Zhenyu, et al. R–OC Criterion for Dam Deformation Monitoring Model Identification [J]. Advanced Engineering Sciences, 2023, 55(3): 175-185. doi: 10.15961/j.jsuese.202200135

大坝变形监控模型识别的R–OC准则

基金项目: 国家重点研发计划项目(2018YFC0407103)
详细信息
    • 收稿日期:  2022-02-22
    • 网络出版时间:  2022-07-29 03:08:30
  • 作者简介:

    张博(1998—),男,硕士生. 研究方向:水工结构工程及基础工程. E-mail:2425345305@qq.com

    通信作者:

    吴震宇, 副教授,E-mail: wuzhenyu@scu.edu.cn

  • 中图分类号: TV698.1+1

R–OC Criterion for Dam Deformation Monitoring Model Identification

  • 摘要: 大坝变形监控模型的优劣主要体现在模型泛化能力的高低。模型泛化能力指模型对训练集以外样本的预测能力,而欠拟合和过度拟合是导致模型泛化能力不高的主要原因。AIC和BIC准则是目前常用的模型识别方法,但是不能定量比较和评价模型的过度拟合程度。本文通过定义过度拟合系数OC量化模型过度拟合程度,同时采用复相关系数R定量评判模型是否欠拟合,建立了R–OC模型识别准则。首先,将大坝变形监测序列划分为拟合时段数据和验证时段数据,采用全回归方法对拟合时段数据进行拟合,构建多种位移监控模型。再根据监控模型的估计值和估计误差的概率分布确定异常监测数据的预警界限,计算各监控模型的误警率FAR。最后,根据不同监控模型对拟合时段和验证时段的拟合和预测误差评价指标(均方根误差RMSE、平均绝对误差MAE、平均绝对百分比误差MAPE),确定过度拟合系数OC;结合复相关系数R,绘制2维散点图,并对各监控模型的泛化能力进行评价。结果表明:过度拟合系数OC同模型的误警率呈良好的相关关系,当过度拟合系数OC小于1时,监控模型没有过度拟合,模型误警率FAR为0,不会发出错误预警;当OC大于1时,模型误警率FAR与OC呈正相关关系。一方面,R–OC模型识别准则通过复相关系数R刻画模型的拟合精度;另一方面,通过过度拟合系数OC定量评判模型的过度拟合程度。对于不同数量的待选模型,R–OC准则均能识别出拟合和预测精度都较高的模型。

     

    Abstract: The advantages and disadvantages of dam deformation monitoring model are mainly reflected in the generalization ability of the model. Model generalization ability refers to the prediction ability of the model for samples outside the training set, and under-fitting and over-fitting are the main reasons for the low generalization ability of the model. Akaike Information Criterion (AIC) and Bayesian Information Criterion (BIC) are two commonly used model identification methods at present, but they cannot quantitatively compare and evaluate the over-fitting degree of the model. In this paper, the over-fitting degree of the model is quantified by defining the over-fitting coefficient (OC). At the same time, the complex correlation coefficient (R) is used to quantitatively judge whether the model is under-fitting, and the R–OC model recognition criterion is established. Firstly, the dam deformation monitoring sequence is divided into fitting data and verification data, and the fitting data are fitted by the total regression method to construct a variety of deformation monitoring models. Then, according to the estimation value of the monitoring model and the probability distribution of the estimation error, the early-warning limits of the abnormal monitoring data is determined. The False Alarm Rate (FAR) of each monitoring model is then calculated. Finally, according to the evaluation indexes (root mean square error (RMSE), mean absolute error (MAE), mean absolute percentage error (MAPE)) of fitting and prediction errors of fitting period and verification period of different monitoring models, the OC was determined. The two-dimensional scatter plot was drawn with the use ofR, and the generalization ability of each monitoring model was evaluated. The results show that the OC has a good correlation with the FAR of the model. When the OC is less than 1, the monitoring model does not over-fit and will not issue error warning, and the FAR of the model is 0. When OC is greater than 1, the model FAR is positively correlated with OC. On the one hand, the R–OC model identification criterion describes the fitting accuracy of the model by theR. On the other hand, the over-fitting degree of the model is quantitatively evaluated by the OC. For different number of models to be selected, R–OC criteria can identify models with high fitting and prediction accuracy.

     

  • 中国目前已修建水库大坝9.8万余座,带来巨大社会经济效益的同时,其安全风险也不容忽视[1]。变形监测是大坝长期运行安全的重要手段[2-3],常通过分析变形监测数据来诊断坝体结构性态,预测大坝发展趋势。而构建监控模型是分析大坝变形监测数据的常用方法,通常根据监控模型预测的预警界限对大坝变形进行异常预警,因此,构建大坝变形监控模型对于大坝安全管理具有重要意义。

    大坝变形监测数据序列一般由两部分组成,即由水库水位和环境温度变化引起的可逆变形和大坝随时间演变的不可逆变形。基于监测资料,应用回归方法进行分析,可将影响大坝变形的因素归结为水压、温度和时效分量[4]。在3种分量中,水压分量一般采用上游相对水深3次幂多项式的形式[5]。温度分量可由多个周期谐波的三角函数[6]、变形测量前多段平均气温的线性组合[7]构成,或对坝体温度计监测数据进行主成分分析,将主成分的线性组合作为温度分量[8]。时效分量一般通过预设不同函数进行模拟,多采用线性函数和对数函数组合[9-11]、线性函数和指数函数组合[12-14]、指数和多项式组合[15-16]等形式构建,也可采用EMD方法分离出大坝变形监测序列时效分量,使非平稳的大坝变形时间序列平稳化,能有效提高预测精度[17-18]

    对于同一个变形测点,通过不同形式的水压、温度和时效分量的组合,可以建立多种大坝变形监控模型,因此,需要从所有待选模型中识别出最优模型。大坝变形监控模型的优劣主要体现为模型泛化能力的高低。模型泛化能力即模型对训练集外样本的预测能力,欠拟合与过度拟合均会导致监控模型的泛化能力不足[19]。欠拟合是指建立的监控模型不能从历史监测数据充分学习和准确描述大坝变形监测量的统计变化规律,具体表现为监控模型对历史监测数据的回归显著性较低,拟合误差较大,常通过复相关系数R、均方根误差RMSE、平均绝对误差MAE、平均绝对百分比误差MAPE等指标进行评判[20-21]R越大,表明监控模型对历史监测数据的回归显著性越高,RMSE、MAE、MAPE的值越小,表明模型拟合误差越小。而过度拟合表现为模型对监测序列的过度学习,甚至会捕捉到训练集中单个样本的特征拟合抽样误差,从而导致模型泛化能力降低,出现对监测数据异常的误判。AIC、BIC准则被广泛应用于监控模型识别[22-25],均采用似然函数度量模型拟合误差,同时引入模型参数数量的惩罚项。经实际应用检验,AIC准则适用于样本量较小的情况,BIC准则适用于样本量较大的情况。但AIC、BIC准则不能定量比较和评价模型的过度拟合程度,在某些情况下,识别出的最优模型可能存在严重的过度拟合问题。因此,在进行模型选择时,需要能够量化模型过度拟合程度的识别准则。

    本文定义了能够量化模型过度拟合程度的指标—过度拟合系数OC,同时采用复相关系数R刻画模型的拟合精度,提出了大坝变形监控模型识别的R–OC准则。将R–OC准则应用于某大坝垂直位移测点的变形监控模型优选,并与AIC和BIC准则进行对比,验证了R–OC准则的有效性。

    大坝变形监控模型一般由水压分量、温度分量和时效分量构成,表达式如下:

    $$ {\qquad Y\left( t \right) = {F_1}\left( {H\left( t \right)} \right) + {F_2}\left( {T\left( t \right)} \right) + {F_3}\left( {\theta \left( t \right)} \right) + C} $$ (1)

    式中, $ Y({t}) $ 为坝体变形监测值在时间 $t$ 的统计估计值, $ {F_1}[H(t)] $ 为坝体变形的水压分量, $ {F_2}[T(t)] $ 为坝体变形的温度分量, $ {F_3}[\theta (t)] $ 为坝体变形的时效分量, $C$ 为待定常数项。

    大坝变形的水压分量与上、下游水位的乘幂相关,对水位进行归一化处理[26],构造形式如下:

    $$ {F_1}(H(t)) = \sum_{{{i = }}1}^3 {{a_{{\rm{u}}i}}} {\left( {\frac{{{H_t} - {H_{\min }}}}{{{H_{\max }} - {H_{\min }}}}} \right)^i}{{ + }} \sum_{{{i}}=1}^3 {{a_{{\rm{d}}i}}{{\left( {\frac{{{h_t} - {h_{\min }}}}{{{h_{\max }} - {h_{\min }}}}} \right)}^i}} $$ (2)

    式中, ${a_{{\rm{u}}i}}$ ${a_{{\rm{d}}i}}$ 分别为上、下游水位因子的待定回归系数, $ {H_t} $ $ {h_t} $ 分别为 $ t $ 时刻的上、下游水位, $ {H_{\min }} $ $ {H_{\max }} $ 分别为大坝运行时期最低、最高上游库水位, $ {h_{\min }} $ $ {h_{\max }} $ 分别为大坝运行时期最低、最高下游库水位。

    当水位对大坝变形影响存在滞后时,水压分量与观测日前j天的平均水位呈线性关系:

    $$ {F_1'}(H(t)) = \sum_j {a_j'{{\overline {h}}_j}} $$ (3)

    式中: $ a{'_j} $ 为待定回归系数; ${\overline h_j}$ 对应监测日前5、10、15、60 d的平均下游水位; ${F_1'}(H(t))$ 为水位滞后影响的水压分量;j为项数,分别对应监测日前5、10、15、60 d。

    1.2.1   传统温度分量

    1)多个周期谐波三角函数

    引起坝体位移的温度因素主要是边界温度及坝体混凝土的水化热。对于运行时间较长的大坝,水化热可忽略不计。坝体温度基本呈年周期性变化。因此,可采用多个周期谐波的三角函数作为统计模型的温度分量,具体构造如下:

    $$ {F_2}\left( {{{T}}(t)} \right){{ = }}{b_1}{\rm{cos}} \;s + {b_2}{\rm{sin}} \;s + {b_3}{{\rm{sin}} ^2}\;s + {b_4}{\rm{sin}} \;s \cos \;s $$ (4)
    $$ s = 2\Pi (t - {t_0})/365.25 $$ (5)

    式(4)~(5)中, $ {b_i}(i = 1,2,3,4)$ 为待定回归系数, $ {t_0} $ 为设定的1月1日的初始时间。

    2)多段平均气温线性组合

    坝体边界温度的变化都是由于气温的季节性变化引起。当外部环境气温监测序列完整时,温度分量可采用多段平均气温的线性组合,函数构造如下:

    $$ {F_2}\left( {{{T}}(t)} \right){\text{ = }}\sum_{i = 1}^4 {{b_i}} {T_i} $$ (6)

    式中, $ {b_i}(i = 1,2,3,4) $ 为待定回归系数, $ {T_i} $ 代表观测日当天及前5、15、60 d的平均大气气温。

    1.2.2   基于主成分分析的温度分量

    当坝体埋设的温度计较多且监测数据连续时,可采用坝体温度监测序列的主成分构造大坝变形的温度分量,能有效减少模型的变量和参数,降低模型的过度拟合程度。

    假设坝体埋设了 $ p $ 支温度计,每支温度计有 $ n(n \gt p) $ 个监测数据,表达为矩阵形式:

    $${\quad {\boldsymbol{X}} = \left[ {\begin{array}{*{20}{c}} {{x_{11}}} & {{x_{12}}} & \cdots & {{x_{1p}}} \\ {{x_{21}}} & {{x_{22}}} & \cdots & {{x_{2p}}} \\ \vdots & \vdots & \ddots & \vdots \\ {{x_{n1}}} & {{x_{n2}}} & \cdots & {{x_{3p}}} \end{array}} \right] = \left[ {{{\boldsymbol{x}}_1},{{\boldsymbol{x}}_2}, \cdots ,{{\boldsymbol{x}}_i},\cdots,{{\boldsymbol{x}}_p}} \right]} $$ (7)

    式中, ${{\boldsymbol{x}}_i} = {\left( {{x_{1i}},{x_{2i}}, \cdots ,{x_{ni}}} \right)^{\rm{T}}}$ i=1,2,···, p

    并计算相关系数矩阵:

    $$ {{\boldsymbol{r}}_{ij}} = \frac{{\displaystyle\sum_{k = 1}^n {\left( {{x_{ki}} - {{\overline x}_i}} \right)\left( {{x_{kj}} - {{\overline x}_j}} \right)} }}{{n - 1}} $$ (8)

    为消除量纲不同带来的影响,对数据 ${\boldsymbol{X}}$ 进行标准化处理,使变量的平均值为0,方差为1,标准化公式如下:

    $$ {\quad {{\boldsymbol{x}}_{ij}} = \frac{{{x_{ij}} - {{\overline x}_j}}}{{\sqrt {D\left( {{x_j}} \right)} }} (i = 1,2, \cdots ,n;j = 1,2, \cdots, p)} $$ (9)

    式中:

    $$ {\overline x_j} = \frac{1}{n}\sum_{i = 1}^n {{x_{ij}}} $$ (10)
    $$ {\qquad D\left( {{x_j}} \right) = \frac{1}{{n - 1}}{\sum_{i = 1}^n {\left( {{x_{ij}} - {{\overline x}_j}} \right)} ^2} }$$ (11)

    计算相关系数矩阵的特征值和对应的特征向量,依次排列大小,相应的单位特征向量如下:

    $${\quad {{\boldsymbol{a}}_1} = \left[ {\begin{array}{*{20}{c}} {a{}_{11}} \\ {{a_{21}}} \\ \vdots \\ {{a_{p1}}} \end{array}} \right] , {{\boldsymbol{a}}_2} = \left[ {\begin{array}{*{20}{c}} {a{}_{12}} \\ {{a_{22}}} \\ \vdots \\ {{a_{p2}}} \end{array}} \right] ,\cdots,{{\boldsymbol{a}}_p} = \left[ {\begin{array}{*{20}{c}} {a{}_{1p}} \\ {{a_{2p}}} \\ \vdots \\ {{a_{pp}}} \end{array}} \right]} $$ (12)

    则第i个主成分 $ P{C_i} $ i=1,2,···, p)的表达式为:

    $$ P{C_i} = {a_{1i}}{x_1} + {a_{2i}}{x_2} + \cdots + {a_{pi}}{x_p}, i = 1,2, \cdots ,p $$ (13)

    式中, $P{C_i}(i = 1,2, \cdots ,p)$ 为对筛选出的坝体温度计进行主成分分析后得到的主成分因子。

    通过式(14)计算各主成分贡献率,并由大到小累加,根据式(15)计算累积贡献率。

    $$ {\qquad\qquad {\eta _j} = \frac{{{\lambda _i}}}{{\displaystyle\sum_{k = 1}^p {{\lambda _k}} }}, i = 1,2, \cdots ,p} $$ (14)
    $$ {M_m} = \frac{{\displaystyle\sum_{i = 1}^m {{\lambda _i}} }}{{\displaystyle\sum_{k = 1}^p {{\lambda _k}} }}, m \lt p $$ (15)

    式(14)~(15)中, $ {\lambda _i} $ 为特征值, $ {\eta _j} $ 为各主成分贡献率, $ {M_m} $ 为主成分累积贡献率。

    选取合适的主成分 $ P{C_i} $ 作为因子,进行温度分量的构造,构造形式如下:

    $$ {F_2}\left( {{{T}}(t)} \right){\text{ = }}\sum\limits_{i = 1}^m {{b_i}P{C_i}} $$ (16)

    式中: $ {b_i}(i = 1,2,3,4) $ 为待定回归系数; $ m $ 为所选取的主成分因子个数,一般选取累积贡献率大于85%或95%的主成分个数。

    1.3.1   传统时效分量

    时效分量反映了大坝的不可逆变形。常采用如下两种形式来表示:

    $$ {F_3}\left( {\theta \left( t \right)} \right){\text{ = }}{c_1}\theta + {c_2}\ln \;\theta $$ (17)
    $$ {F_3}\left( {\theta \left( t \right)} \right){\text{ = }}{c_1}\theta + {c_2}{{\rm{e}}^{ - \theta }} $$ (18)

    式(17)~(18)中, $\theta {{ = ( }}t{{ - }}{t_0})/100$ ${t_0}$ 为监测点初始监测日的时间, ${c_1}$ ${c_2}$ 为待定回归系数。

    1.3.2   基于经验模态分解的时效分量

    通过经验模态分解法(EMD)将大坝变形监测效应量分解并重构为周期变化项和时效趋势项,选择合适的函数形式对时效趋势项进行拟合,构建时效分量模型。该方法能克服传统方法在未知时效分量实际变化规律和趋势情况下预设模型形式的缺点。

    EMD的步骤如下:

    1)找出 $x(t)$ 上所有极值点xmax(t)、xmin(t)。

    2)通过3次样条差值函数将极值点连接,绘制上、下包络线。上、下包络线的均值 ${m_1}(t)$ 可以表示为:

    $${\qquad {m_1}(t) = ({x_{\max }}(t) + {x_{\min }}(t))/2 }$$ (19)

    3)计算原始数据和 ${m_1}(t)$ 之间的差值 ${h_1}(t)$

    $$ {h_1}(t) = x(t) - {m_1}(t) $$ (20)

    4)用 ${h_1}(t)$ 替换 $x(t)$ ,重复上述3个步骤,直到满足相应的终止条件:①数据序列的零点数 $m$ 和极值点数 $n$ 满足不等式 $\left| {m - n} \right| \leqslant 1$ ;②上下包络线的均值 ${m_1}(t)$ 趋于0。

    第1个 $im{f_1}(t)$ 分量可表示为:

    $$ im{f_1}(t) = {h_1}(t) $$ (21)

    5)计算原始数据和 $im{f_1}(t)$ 之间的差值 ${r_1}(t)$

    $$ {r_1}(t) = x(t) - im{f_1}(t) $$ (22)

    6)将步骤1)中的 $x(t)$ 替换为 ${r_1}(t)$ ,重复步骤1)~5),直到 ${r_n}(t)$ 残差单调或小于预设误差,EMD分解终止。

    变形监测数据时间序列EMD分解的数学表达式如下:

    $$ {\qquad x(t) = \sum_{i = 1}^n {im{f_i}} (t) + {r_n}(t) (i=1,2,\cdots, {n})}$$ (23)

    式(19)~(23)中, $x(t)$ 为变形监测测点在时间 $t$ 的监测效应量, $im{f_i}(t)$ 为通过EMD分解得到的 $n$ 阶IMF分量, ${r_n}(t)$ 为监测数据序列 $x(t)$ 的时效趋势项。

    则时效分量 ${F_3}\left( {\theta (t)} \right)$ 可表示为:

    $$ {F_3}\left( {\theta \left( t \right)} \right) = {r_n}(t) $$ (24)

    对于时效分量 ${F_3}\left( {\theta (t)} \right)$ ,本文采用如下复合指数函数进行拟合:

    $${\qquad {F_3}\left( {\theta \left( t \right)} \right) = a \cdot \exp (b{\theta ^c}) + d} $$ (25)

    式中, $ a、b、c、{d} $ 为待定拟合参数, $\theta {\text{ = (}}t{{ - }}{t_0})/100$ ${t_0}$ 为监测点初始监测日的时间。

    2.1.1   AIC准则

    AIC准则是衡量统计模型拟合优良性的一种标准,由日本统计学家Akaike在1974年提出,公式如下:

    $$ {\rm{AIC}} = 2k - 2\ln \;L $$ (26)

    式中, $k$ 为模型参数个数, $L$ 为似然函数。

    从待选模型中选择最佳模型时,通常选择AIC值最小的模型。一般而言,当模型复杂度提高时,似然函数 $L$ 增大,从而AIC值减小;但当 $k$ 过大时,似然函数增速减缓,导致AIC增大。因此模型过于复杂容易造成过度拟合现象,而 $2k$ 可以作为对参数的惩罚。AIC准则的实质就是由候选模型取最大似然后加上一个惩罚项得到的,可以衡量模型参数复杂度与拟合优度之间的平衡关系,并选择模型参数较少但拟合度较好的模型作为最优模型。

    2.1.2   BIC准则

    BIC准则是Schwartz于1978年根据Bayes理论提出的判别准则,引入了后验概率的思想,其计算公式如下:

    $$ {\rm{BIC}} = k\ln \;n - 2\ln \;L $$ (27)

    式中, $k$ 为模型参数个数, $n$ 为样本数量, $L$ 为似然函数。

    BIC准则与AIC准则的差别主要体现在惩罚项,考虑到样本个数会对模型选择起到一定的影响作用,所以在BIC准则中加入样本量 $n$ 作为模型惩罚项的一部分;当样本数量过多时,可有效防止模型精度过高造成的模型复杂度过高。最优模型通常为 ${\rm{BIC}}$ 值最小的模型。

    过度拟合是导致模型泛化能力降低的主要原因之一,通常表现为模型对历史数据的拟合精度很高,但预测精度明显低于拟合精度。因此,可以通过比较模型预测误差和拟合误差来确定模型的过度拟合程度。本文提出模型过度拟合系数OC,其表达式如下:

    $${\qquad {\rm{OC}} = \frac{1}{3}\left(\frac{{{\rm{RMSE}}_{\rm{V}}}}{{{\rm{RMSE}}_{\rm{F}}}} + \frac{{{\rm{MAE}}_{\rm{V}}}}{{{\rm{MAE}}_{\rm{F}}}} + \frac{{{\rm{MAPE}}_{\rm{V}}}}{{{\rm{MAPE}}_{\rm{F}}}}\right)} $$ (28)

    式中,RMSE为均方根误差,MAE为平均绝对误差,MAPE为平均绝对百分比误差,下标V和下标F分别代表验证时段和拟合时段。相应的RMSE、MAE及MAPE的值定量反映了监控模型预测误差和拟合误差的大小。

    RMSE、MAE和MAPE是常用的误差评价指标[21],但各有优缺点。RMSE能够很好地反映拟合值与监测数据的偏差,但对于远离监测数据均值的异常值很敏感,其表达式如下:

    $$ {\rm{RMSE}} = \sqrt {\frac{{\displaystyle\sum_{i = 1}^n {{{({y_i} - {{\hat y}_i})}^2}} }}{n}} $$ (29)

    MAE克服了RMSE的缺点,能更好地反映拟合值误差的实际情况,但不能合理反映模型拟合的相对误差,其表达式如下:

    $$ {\rm{MAE}} = \frac{1}{n}\sum_{i = 1}^n {\left| {({y_i} - {{\hat y}_i})} \right|} $$ (30)

    MAPE适合评价相对误差,缺点是当实测值为0时,将无法计算,其表达式如下:

    $$ {\rm{MAPE}} = \frac{1}{n}\sum_{i = 1}^n {\left| {\frac{{({y_i} - {{\hat y}_i})}}{{{y_i}}}} \right|} $$ (31)

    当模型过度拟合时,验证时段的模型预测误差将大于拟合时段的拟合误差,即:当OC>1,且OC的值越大,表明模型过度拟合程度越高;反之,当OC<1时,且OC的值越小,表明模型预测精度高于拟合精度,不存在过度拟合,预测精度相对越好;当OC=1时,表示预测精度和拟合精度相同。因此,OC能定量反映监控模型的过度拟合程度。

    而进行模型选择时,既要保证模型验证时段数据的预测精度,不能存在过度拟合;也要保证模型拟合时段数据的拟合精度,不能存在欠拟合。因此本文选用复相关系数R定量反映模型拟合时段数据的拟合精度。

    复相关系数R反映一个因变量与多个自变量之间的相关程度,其表达式如下:

    $$ \begin{aligned}[b] R{\text{ = }}& \sqrt {{R^2}} {\text{ = }}\sqrt {\frac{{{\rm{SSR}}}}{{{\rm{SST}}}}} = \sqrt {\frac{{\displaystyle\sum_{i = 1}^n {{{({{\hat Y}_i} - \overline Y)}^2}} }}{{\displaystyle\sum_{i = 1}^n {{{({Y_i} - \overline Y)}^2}} }}}= \\& \sqrt {1 - \frac{{\displaystyle\sum_{i = 1}^n {{{({Y_i} - {{\hat Y}_i})}^2}} }}{{\displaystyle\sum_{i = 1}^n {{{({Y_i} - \overline Y)}^2}} }}} \end{aligned}$$ (32)

    式中,R2为可决系数,SSR为回归平方和,SST为总偏差平方和, $ {Y_i} $ 为观测数据, $\overline Y$ 为观测数据均值, $ {\hat Y_i} $ 为拟合数据。

    回归平方和SSR反映回归方程中全部自变量的“方差贡献”。可决系数R2表示这种贡献在总偏差平方和SST中所占的比重,R2越大,说明自变量对因变量的解释程度越高,引起的变动占总变动的比重越大,模型拟合程度就越高;反之,说明模型对样本观测值的拟合效果越差。因此,复相关系数R越大,监控模型的拟合时段数据的拟合精度就越高。

    本文基于反映模型拟合精度的指标R和反映过度拟合程度的指标OC,提出了一种新的大坝变形监控模型识别的R–OC准则。在进行模型选择时,可将指标R和OC绘制为2维散点图,从而可以直观地挑选出拟合精度高、过度拟合程度低的模型。

    国内某水电站工程,属二等大(2)型工程,由左岸重力式挡水坝段、河床式电站厂房坝段、河床4孔泄洪闸坝段、右岸导流明渠内3孔泄洪闸坝段、右岸重力式挡水坝段等建筑物组成。水库正常蓄水位为1 015 m,死水位为1 012 m,坝顶高程1 020 m,最大坝高69.5 m,水库具有日调节性能。

    选取10#坝段真空激光准直系统LA14测点垂直位移构建位移监控模型,测点布置情况如图1所示。10#坝段长30 m,顺水流方向长60 m,最大闸坝高60 m,堰顶高程994 m。为监测坝体运行期温度场的变化情况,在10#坝段坝体内共埋设30支温度计,封存停测后纳入运行期统计共计14支,具体仪器布置情况如图2所示。

    图  1  LA14测点布置及工程鸟瞰图
    Fig.  1  LA14 measurement point layout and engineering aeroview
    下载: 全尺寸图片
    图  2  10#坝段温度计布置图
    Fig.  2  10# dam section thermometer layout
    下载: 全尺寸图片

    在建模时段内大坝正常运行,工作性态良好,巡视检查未发现异常的变形迹象。收集LA14测点垂直位移自2017年7月6日至2021年3月30日的完整监测数据,测量频率为1 次/d。剔除异常值后,获得1 238组实测序列,用以构建模型的样本观测值。为检验监控模型的预测效果,将数据序列分成拟合时段和验证时段数据。拟合时段数据用于拟合构建监控模型,通过监控模型对LA14测点位移进行预测得到预测数据,并同验证时段内的LA14测点位移的实测值进行对比分析。其中,拟合时段起止时间为2017年7月6日至2020年12月31日,验证时段起止时间为2021年1月1日至2021年3月30日。LA14测点全过程时间序列曲线如图3所示。

    图  3  LA14测点全过程时间序列曲线
    Fig.  3  Whole process time series curve of LA14 measuring point
    下载: 全尺寸图片
    3.2.1   水压分量

    水压分量根据第1.1节中的形式进行构建,统一对上下游水位进行归一化处理,且需考虑下游水位的滞后性。

    3.2.2   温度分量

    1)传统温度分量:由于该水电站运行多年,水化热已释放完毕,坝体内部温度场已趋向稳定,故在回归计算时,水化热可不予考虑;且外部环境气温监测序列完整。因此,温度分量可分别采用第1.2节中的形式进行构建。

    2)基于PCA的温度分量:通过数据筛选,选择T01–XHZ、T04–XHZ、T05–XHZ、T10–XHZ、T14–XHZ、T15–XHZ、T16–XHZ、T17–XHZ、T21–XHZ、T23–XHZ、T28–XHZ、T29–XHZ共12支温度计,形成温度主成分PC1PC2、···、PC12,各主成分贡献率及累积贡献率如图4所示。

    图  4  温度监测数据主成分的贡献率及累积贡献率
    Fig.  4  Contribution rates and cumulative contribution rates of principal components in temperature monitoring data
    下载: 全尺寸图片

    图4可得,当选取前4支主成分PC1PC2PC3PC4时,累积贡献率达到99.60%,可近似表示上述12支温度计在所选时段的所有包含信息,达到降维处理的目的。因此,将主成分PC1PC2PC4作为温度分量因子。

    3.2.3   时效分量

    1)传统时效分量:时效分量可采用第1.3.1节中的形式进行构建。

    2)基于EMD的时效分量:对LA14测点监测数据序列进行EMD分解,根据EMD提取的时效位移时间序列,选择复合指数函数构建时效分量,采用遗传算法确定复合指数函数的系数。LA14测点EMD时效分量及复合函数拟合效果如图5所示。

    图  5  LA14测点EMD分解重构及拟合
    Fig.  5  EMD decomposition reconstruction and fitting of LA14 measuring point
    下载: 全尺寸图片

    拟合结果显示,复相关系数R>0.99,均方根误差RMSE<0.01,即复合指数函数对分解出的坝顶时效位移拟合效果良好。

    大坝变形监控模型一般包含水压、温度和时效分量3部分,通过选取上述构建的水压、温度和时效分量不同的函数形式进行组合,并确定是否考虑下游水位滞后,即可构建不同的监控模型,本文总计建立18种大坝变形待选监控模型。各监控模型表达式见表1

    表  1  LA14测点垂直位移监控模型汇总
    Table  1  Summary of LA14 vertical displacement monitoring model
    模型序号 水压分量 温度分量 时效分量
    $\begin{gathered} \displaystyle\sum\limits_{i = 1}^3 { {a_i} } {\left(\frac{ { {H_t} - {H_{\min } } } }{ { {H_{\max } } - {H_{\min } } } }\right)^i} + \\ \displaystyle\sum\limits_{i = 1}^3 { {a_i} } {\left(\frac{ { {h_t} - {h_{\min } } } }{ { {h_{\max } } - {h_{\min } } } }\right)^i} \\ \end{gathered}$ $\displaystyle\sum\limits_{i' = 1}^4 { {a_{i'} } } {\left(\dfrac{ { {h_t} - {h_{\min } } } }{ { {h_{\max } } - {h_{\min } } } }\right)_{i'} }$ $\begin{gathered}{b_1}\cos \;s + \\{b_2}\sin \;s + \\ {b_3}{\sin ^2}s + \\{b_4}\sin \;s\cos \;s \end{gathered}$ $\displaystyle\sum\limits_{i' = 1}^4 { {b_i} } {T_i}$ $\displaystyle\sum\limits_{i = 1}^m { {b_i}P{C_i} }$ ${c_1}\theta + {c_2}\ln\; \theta$ ${c_1}\theta + {c_2}{{\rm{e}}^{ - \theta } }$ $a \cdot \exp (b{\theta ^c}) + d$
    1#
    2#
    3#
    4#
    5#
    6#
    7#
    8#
    9#
    10#
    11#
    12#
    13#
    14#
    15#
    16#
    17#
    18#
      注:“√”表示监控模型所选因子,“—”表示监控模型不选择此因子。

    采用全回归方法对LA14测点进行拟合。在评判预测效果时,使用核密度估计法进行分布拟合,其表达式如下:

    $$ {\hat f _h}(x) = \frac{1}{{nh}}\sum\limits_{i = 1}^n K \left(\frac{{x - {x_i}}}{h}\right) $$ (33)

    式中, ${\hat f _h}(x)$ 为残差样本 $ x $ 的分布概率, $ K、 h $ 分别为核函数、平滑参数, $ {x_i} $ 为参与统计的数据信息。

    根据监控模型对LA14测点位移的估计值和估计误差的概率分布确定异常监测数据的预警界限。其中,预警上限为 ${\rm{UCL}} = E + {\varDelta _{97.5\text{%} }}$ ,预警下限为 ${\rm{LCL}} = E + {\varDelta _{2.5\text{%} }}$ $E$ 为LA14测点位移的模型估计值, ${\varDelta _{2.5\text{%} }}$ ${\varDelta _{97.5\text{%} }}$ 分别为模型估计误差的2.5%和97.5%分位值。当新获得的监测数据超出预警界限时,则判断为异常数据,并发出预警。

    由于案例分析中的重力坝在验证时段内处于正常运行状态,巡视检查未见任何异常变形迹象,验证时段内的监测数据不应超出预警界限。因此,本文将监控模型的误警率定义为验证时段内被误判为异常数据的数量与该时段监测数据总数比值。

    模型评价指标及误警率FAR计算结果见表2

    表  2  模型评价指标及误警率统计结果
    Table  2  Statistical results of model evaluation indenes and false alarm rates
    模型序号 复相关系数R LA14(垂直方向)
    拟合时段数据 验证时段数据 过度拟合系数OC AIC BIC FAR/%
    RMSE MAE MAPE RMSE MAE MAPE
    1# 0.968 0.239 0.174 2.143 0.481 0.473 0.192 1.61 610.98 640.85 58.43
    2# 0.970 0.234 0.171 2.243 0.480 0.471 0.193 1.63 597.55 637.36 70.79
    3# 0.894 0.428 0.333 1.513 0.265 0.227 0.091 0.45 1258.71 1288.57 0
    4# 0.937 0.334 0.252 1.094 0.471 0.443 0.188 1.11 1005.66 1045.48 10.11
    5# 0.973 0.220 0.167 1.461 0.489 0.481 0.196 1.75 522.25 552.12 70.79
    6# 0.974 0.215 0.163 1.557 0.493 0.484 0.198 1.80 505.34 545.16 78.65
    7# 0.896 0.426 0.336 1.459 0.324 0.285 0.113 0.56 1260.08 1289.95 0
    8# 0.938 0.332 0.252 1.107 0.474 0.447 0.189 1.12 998.27 1038.09 10.11
    9# 0.928 0.316 0.211 4.342 0.103 0.084 0.033 0.24 869.73 894.61 0
    10# 0.930 0.312 0.210 4.423 0.125 0.104 0.041 0.30 864.61 899.45 0
    11# 0.843 0.457 0.345 1.346 0.278 0.228 0.093 0.45 1335.38 1360.27 0
    12# 0.893 0.383 0.290 2.203 0.198 0.168 0.069 0.38 1119.38 1154.22 0
    13# 0.970 0.231 0.182 0.707 0.101 0.082 0.031 0.31 487.73 517.59 0
    14# 0.973 0.219 0.147 0.687 0.157 0.136 0.056 0.58 438.78 478.60 0
    15# 0.971 0.227 0.151 0.690 0.129 0.103 0.039 0.44 470.63 500.50 0
    16# 0.974 0.217 0.146 0.670 0.155 0.136 0.055 0.58 423.44 463.26 0
    17# 0.931 0.311 0.225 1.023 0.539 0.517 0.200 1.41 928.78 953.67 31.46
    18# 0.936 0.299 0.215 1.034 0.509 0.455 0.170 1.33 878.22 908.08 40.45

    1)将表2中过度拟合系数OC、AIC值、BIC值和误警率FAR分别绘制成散点图,以OC=1.0和OC=1.2的直线将模型分为无过度拟合、低过度拟合、高过度拟合3种类型;以FAR=0和FAR=0.25的直线将模型分为无误警、低误警、高误警3种类型,结果如图67所示。

    图  6  监控模型的过度拟合系数与误警率散点图
    Fig.  6  Scatter plot of over-fitting coefficients and false alarm rates of monitoring model
    下载: 全尺寸图片
    图  7  监控模型的AIC和BIC计算值与误警率散点图
    Fig.  7  Scatter plot of AIC and BIC values and false alarm rates of monitoring model
    下载: 全尺寸图片

    图6可知:过度拟合系数OC和误警率FAR的散点图呈较明显的线性关系;当无过度拟合现象时(OC≤0),模型误警率 ${\rm{FAR}}$ 均为0;当过度拟合程度较低时(1.00<OC≤1.20),模型为低误警(0<FAR≤0.25);当过度拟合系数较高时(OC>1.20),模型为高误警(FAR>0.25)。因此,模型误警率FAR与过度拟合系数OC大致呈正相关关系。

    图7可知,AIC、BIC准则同误警率FAR无明显关系。1#、2#、5#、6#等模型的AIC、BIC值相对较低,但误警率FAR均高于50%,属于高误警类型;3#、7#、11#、12#等模型AIC、BIC值虽相对较高,但误警率FAR均为0,属于无误警类型。因此,AIC、BIC准则不能良好地反映模型误警率FAR,与AIC、BIC值越小,模型效果越好的规则相矛盾。

    因此,从模型误警率FAR的角度出发,R–OC准则中的过度拟合系数OC比AIC、BIC准则更能反映大坝变形监控预警的真实情况。

    2)当采用AIC、BIC准则选取模型时,根据AIC、BIC值最小原则,最优模型为16#模型,其拟合段精度最高为0.974,但验证时段数据的预测效果并非最好,过度拟合系数为0.58。

    采用R–OC准则选取模型时,将复相关系数R和过度拟合系数OC绘制成散点图,选出的较优模型用红线圈出,如图8所示。

    图  8  监控模型的R和OC指标的散点图
    Fig.  8  Scatter plot of R and OC indexes of the monitoring model
    下载: 全尺寸图片

    图8中左上角区域(OC>1.0,R<0.9)中的模型既有欠拟合又存在过度拟合;右上角区域(OC>1.0,R≥0.9)中的模型无欠拟合但存在过度拟合;左下角区域(OC≤1.0,R<0.9)中的模型有欠拟合但无过度拟合;右下角区域(OC≤1.0,R≥0.9)中的模型既无欠拟合又无过度拟合。因此,满足OC≤1.0、R≥0.9的模型为较优模型。当所有模型均不满足此条件时,可以从两个方面进行优化:①改进监控模型的水压、温度和时效分量的函数形式;②采用深度学习算法[27]对历史监测数据进行学习,建立监控模型。在LA14测点较优模型9#、10#、13#、14#、15#、16#模型中,各模型的复相关系数R均在0.9以上,满足模型精度的要求;对比各模型的过度拟合系数OC,并从小到大进行排序,次序为9#、10#、13#、15#、16#、14#,最优模型为9#模型。

    3)根据AIC、BIC准则选择模型时,选择最优模型的准确度受模型数量限制。由表2可知:①当只构建前12种模型时,AIC、BIC准则会将5#模型判定为最优模型,虽然其复相关系数R为0.973,拟合精度最高,但其过度拟合系数为1.75,属于高过度拟合类型,误警率FAR高达70.79%,5#模型预警界限如图9所示。但R–OC准则会选择9#模型,其复相关系数R为0.928,拟合精度满足要求,同时过度拟合系数为0.24,无过度拟合现象,误警率FAR为0。9#模型预警界限如图10所示。②当对18种模型进行选择时,根据第2)点分析,AIC、BIC准则将16#模型判定为最优模型;此时,R–OC准则仍会选择9#模型。

    图  9  基于AIC、BIC准则识别的最优模型(5#模型)的预警界限
    Fig.  9  Early warning limits of optimal model (5# model) based on AIC and BIC criteria
    下载: 全尺寸图片
    图  10  基于R–OC准则识别的最优模型(9#模型)的预警界限
    Fig.  10  Early warning limits of an optimal model (9# model) based on R–OC criterion
    下载: 全尺寸图片

    因此,对于不同数量的待选模型,R–OC准则均能识别出拟合和预测精度都较高的模型,而AIC和BIC准则识别出的最优模型可能会存在较严重的过度拟合现象。

    本文定义了能够量化过度拟合程度的指标,即过度拟合系数OC。同时,为满足既不能欠拟合又不能过度拟合的模型识别原则,结合复相关系数R,提出了大坝变形监控模型识别方法R–OC准则。

    案例分析表明,过度拟合系数OC与误警率FAR存在密切关系,当过度拟合系数OC≤1时,监控模型误警率FAR为0;当过度拟合系数OC>1时,监控模型误警率FAR与过度拟合系数OC呈正相关关系。R–OC模型识别准则弥补了传统模型识别方法AIC、BIC准则不能定量比较和评价模型过度拟合程度的缺陷;通过R和OC两个指标,既保证了模型的拟合精度,又限制了模型的过度拟合程度,合理选择最优模型,提高了模型识别的准确度。同时,对于不同数量的待选模型,R–OC准则均能识别出拟合和预测精度都较高的模型。

  • 图  1   LA14测点布置及工程鸟瞰图

    Fig.  1   LA14 measurement point layout and engineering aeroview

    下载: 全尺寸图片

    图  2   10#坝段温度计布置图

    Fig.  2   10# dam section thermometer layout

    下载: 全尺寸图片

    图  3   LA14测点全过程时间序列曲线

    Fig.  3   Whole process time series curve of LA14 measuring point

    下载: 全尺寸图片

    图  4   温度监测数据主成分的贡献率及累积贡献率

    Fig.  4   Contribution rates and cumulative contribution rates of principal components in temperature monitoring data

    下载: 全尺寸图片

    图  5   LA14测点EMD分解重构及拟合

    Fig.  5   EMD decomposition reconstruction and fitting of LA14 measuring point

    下载: 全尺寸图片

    图  6   监控模型的过度拟合系数与误警率散点图

    Fig.  6   Scatter plot of over-fitting coefficients and false alarm rates of monitoring model

    下载: 全尺寸图片

    图  7   监控模型的AIC和BIC计算值与误警率散点图

    Fig.  7   Scatter plot of AIC and BIC values and false alarm rates of monitoring model

    下载: 全尺寸图片

    图  8   监控模型的R和OC指标的散点图

    Fig.  8   Scatter plot of R and OC indexes of the monitoring model

    下载: 全尺寸图片

    图  9   基于AIC、BIC准则识别的最优模型(5#模型)的预警界限

    Fig.  9   Early warning limits of optimal model (5# model) based on AIC and BIC criteria

    下载: 全尺寸图片

    图  10   基于R–OC准则识别的最优模型(9#模型)的预警界限

    Fig.  10   Early warning limits of an optimal model (9# model) based on R–OC criterion

    下载: 全尺寸图片

    表  1   LA14测点垂直位移监控模型汇总

    Table  1   Summary of LA14 vertical displacement monitoring model

    模型序号 水压分量 温度分量 时效分量
    $\begin{gathered} \displaystyle\sum\limits_{i = 1}^3 { {a_i} } {\left(\frac{ { {H_t} - {H_{\min } } } }{ { {H_{\max } } - {H_{\min } } } }\right)^i} + \\ \displaystyle\sum\limits_{i = 1}^3 { {a_i} } {\left(\frac{ { {h_t} - {h_{\min } } } }{ { {h_{\max } } - {h_{\min } } } }\right)^i} \\ \end{gathered}$ $\displaystyle\sum\limits_{i' = 1}^4 { {a_{i'} } } {\left(\dfrac{ { {h_t} - {h_{\min } } } }{ { {h_{\max } } - {h_{\min } } } }\right)_{i'} }$ $\begin{gathered}{b_1}\cos \;s + \\{b_2}\sin \;s + \\ {b_3}{\sin ^2}s + \\{b_4}\sin \;s\cos \;s \end{gathered}$ $\displaystyle\sum\limits_{i' = 1}^4 { {b_i} } {T_i}$ $\displaystyle\sum\limits_{i = 1}^m { {b_i}P{C_i} }$ ${c_1}\theta + {c_2}\ln\; \theta$ ${c_1}\theta + {c_2}{{\rm{e}}^{ - \theta } }$ $a \cdot \exp (b{\theta ^c}) + d$
    1#
    2#
    3#
    4#
    5#
    6#
    7#
    8#
    9#
    10#
    11#
    12#
    13#
    14#
    15#
    16#
    17#
    18#
      注:“√”表示监控模型所选因子,“—”表示监控模型不选择此因子。

    表  2   模型评价指标及误警率统计结果

    Table  2   Statistical results of model evaluation indenes and false alarm rates

    模型序号 复相关系数R LA14(垂直方向)
    拟合时段数据 验证时段数据 过度拟合系数OC AIC BIC FAR/%
    RMSE MAE MAPE RMSE MAE MAPE
    1# 0.968 0.239 0.174 2.143 0.481 0.473 0.192 1.61 610.98 640.85 58.43
    2# 0.970 0.234 0.171 2.243 0.480 0.471 0.193 1.63 597.55 637.36 70.79
    3# 0.894 0.428 0.333 1.513 0.265 0.227 0.091 0.45 1258.71 1288.57 0
    4# 0.937 0.334 0.252 1.094 0.471 0.443 0.188 1.11 1005.66 1045.48 10.11
    5# 0.973 0.220 0.167 1.461 0.489 0.481 0.196 1.75 522.25 552.12 70.79
    6# 0.974 0.215 0.163 1.557 0.493 0.484 0.198 1.80 505.34 545.16 78.65
    7# 0.896 0.426 0.336 1.459 0.324 0.285 0.113 0.56 1260.08 1289.95 0
    8# 0.938 0.332 0.252 1.107 0.474 0.447 0.189 1.12 998.27 1038.09 10.11
    9# 0.928 0.316 0.211 4.342 0.103 0.084 0.033 0.24 869.73 894.61 0
    10# 0.930 0.312 0.210 4.423 0.125 0.104 0.041 0.30 864.61 899.45 0
    11# 0.843 0.457 0.345 1.346 0.278 0.228 0.093 0.45 1335.38 1360.27 0
    12# 0.893 0.383 0.290 2.203 0.198 0.168 0.069 0.38 1119.38 1154.22 0
    13# 0.970 0.231 0.182 0.707 0.101 0.082 0.031 0.31 487.73 517.59 0
    14# 0.973 0.219 0.147 0.687 0.157 0.136 0.056 0.58 438.78 478.60 0
    15# 0.971 0.227 0.151 0.690 0.129 0.103 0.039 0.44 470.63 500.50 0
    16# 0.974 0.217 0.146 0.670 0.155 0.136 0.055 0.58 423.44 463.26 0
    17# 0.931 0.311 0.225 1.023 0.539 0.517 0.200 1.41 928.78 953.67 31.46
    18# 0.936 0.299 0.215 1.034 0.509 0.455 0.170 1.33 878.22 908.08 40.45
  • [1] 练继建,杨阳,胡少伟,等.特大水利水电枢纽调控与安全运行研究进展与前沿[J].工程科学与技术,2017,49(1):27–32. doi: 10.15961/j.jsuese.2

    Lian Jiyang,Yang Yang,Hu Shaowei,et al.Research progresses and frontiers on control and safety operation of super-large hydraulic complex[J].Advanced Engineering Sciences,2017,49(1):27–32 doi: 10.15961/j.jsuese.2
    [2] Chen Siyu,Gu Chongshi,Lin Chaoning,et al.Prediction of arch dam deformation via correlated multi-target stacking[J].Applied Mathematical Modelling,2021,91:1175–1193. doi: 10.1016/j.apm.2020.10.028
    [3] 卢祥,吴震宇,周正军,等.高心墙堆石坝施工期变形时空预测模型研究[J].工程科学与技术,2017,49(4):61–69. doi: 10.15961/j.jsuese.201601342

    Lu Xiang,Wu Zhenyu,Zhou Zhengjun,et al.Research on the prediction model of deformation of high core rockfill dam during construction period[J].Advanced Engineering Sciences,2017,49(4):61–69 doi: 10.15961/j.jsuese.201601342
    [4] 李明超,任秋兵,孔锐,等.多维复杂关联因素下的大坝变形动态建模与预测分析[J].水利学报,2019,50(6):687–698. doi: 10.13243/j.cnki.slxb.20190304

    Li Mingchao,Ren Qiubing,Kong Rui,et al.Dynamic modeling and prediction analysis of dam deformation under multidimensional complex relevance[J].Journal of Hydraulic Engineering,2019,50(6):687–698 doi: 10.13243/j.cnki.slxb.20190304
    [5] 裴亮,吴震宇,崔萌,等.高土石坝安全监测位移混合模型研究及应用[J].四川大学学报(工程科学版),2012,44(增刊1):42–47. doi: 10.15961/j.jsuese.2012.s1.051

    Pei Liang,Wu Zhenyu,Cui Meng,et al.Research and application on the displacement hybrid-model of high earth dam[J].Journal of Sichuan University(Engineering Science Edition),2012,44(Supp1):42–47 doi: 10.15961/j.jsuese.2012.s1.051
    [6] 魏博文,袁冬阳,李火坤,等.基于参数区间反演修正混合模型的混凝土坝位移监控指标确定方法[J].岩石力学与工程学报,2018,37(增刊2):4151–4160.

    Wei Bowen,Yuan Dongyang,Li Huokun,et al.Method for determining displacement monitoring index of concrete dam based on the hybrid model considering parameter interval inversion modification[J].Chinese Journal of Rock Mechanics and Engineering,2018,37(Supp2):4151–4160
    [7] 许昌,岳东杰,董育烦,等.基于主成分和半参数的大坝变形监测回归模型[J].岩土力学,2011,32(12):3738–3742. doi: 10.16285/j.rsm.2011.12.038

    Xu Chang,Yue Dongjie,Dong Yufan,et al.Regression model for dam deformation based on principal component and semi-parametric analysis[J].Rock and Soil Mechanics,2011,32(12):3738–3742 doi: 10.16285/j.rsm.2011.12.038
    [8] 郑付刚.主成分回归分析在确定大坝效应量分量中的应用[J].水力发电,2010,36(12):84–87.

    Zheng Fugang.Application of principal component regression analysis in determining the component proportion of dam effect variable[J].Water Power,2010,36(12):84–87
    [9] Hu Jiang,Wu Suhua.Statistical modeling for deformation analysis of concrete arch dams with influential horizontal cracks[J].Structural Health Monitoring,2019,18(2):546–562. doi: 10.1177/1475921718760309
    [10] 任秋兵,李明超,沈扬,等.耦合时空相关特性的大坝变形动态监控模型[J].水力发电学报,2021,40(10):160–172.

    Ren Qiubing,Li Mingchao,Shen Yang,et al.Dynamic monitoring model for dam deformation coupling with spatiotemporal correlation characteristics[J].Journal of Hydroelectric Engineering,2021,40(10):160–172
    [11] Wei Bowen,Yuan Dongyang,Li Huokun,et al.Combination forecast model for concrete dam displacement considering residual correction[J].Structural Health Monitoring,2019,18(1):232–244. doi: 10.1177/1475921717748608
    [12] 黄耀英,何一洋,沈振中,等.大坝监测量最佳统计模型优选方法[J].水利学报,2022,53(2):154–164. doi: 10.13243/j.cnki.slxb.20210751

    Huang Yaoying,He Yiyang,Shen Zhenzhong,et al.Optimization method of optimal statistical model of dam monitoring data[J].Journal of Hydraulic Engineering,2022,53(2):154–164 doi: 10.13243/j.cnki.slxb.20210751
    [13] Mata J,de Castro A T,Sá da Costa J.Time–frequency analysis for concrete dam safety control:Correlation between the daily variation of structural response and air temperature[J].Engineering Structures,2013,48:658–665. doi: 10.1016/j.engstruct.2012.12.013
    [14] 徐宝松,刘贝贝,郑东健,等.大坝变形温变效应分析方法研究[J].中国科学(技术科学),2012,42(6):704–712. doi: 10.1360/ze2012-42-6-704

    Xu Baosong,Liu Beibei,Zheng Dongjian,et al.Study on analysis method of temperature change effect of dam deformation[J].Scientia Sinica(Technologica),2012,42(6):704–712 doi: 10.1360/ze2012-42-6-704
    [15] Kang Fei,Liu Xi,Li Junjie.Concrete dam behavior prediction using multivariate adaptive regression splines with measured air temperature[J].Arabian Journal for Science and Engineering,2019,44(10):8661–8673. doi: 10.1007/s13369-019-04095-z
    [16] Juan Mata,Tavares de Castro A,Sá da Costa J.Constructing statistical models for arch dam deformation[J].Structural Control and Health Monitoring,2014,21(3):423–437. doi: 10.1002/stc.1575
    [17] 张豪,许四法.基于经验模态分解和遗传支持向量机的多尺度大坝变形预测[J].岩石力学与工程学报,2011,30(增刊2):3681–3688.

    Zhang Hao,Xu Sifa.Multi-scale dam deformation prediction based on empirical mode decomposition and genetic algorithm for support vector machines(GA-SVM)[J].Chinese Journal of Rock Mechanics and Engineering,2011,30(Supp2):3681–3688
    [18] 冷天培,马刚,向正林,等.基于时序分解与深度学习的堆石坝变形预测[J].水力发电学报,2021,40(10):147–159.

    Leng Tianpei,Ma Gang,Xiang Zhenglin,et al.Deformation prediction of rockfill dams based on time series decomposition and deep learning[J].Journal of Hydroelectric Engineering,2021,40(10):147–159
    [19] Xu Changjiang,Mcleod A I.Further asymptotic properties of the generalized information criterion[J].Electronic Journal of Statistics,2012,6:656–663. doi: 10.1214/12-EJS685
    [20] 李斌,胡德秀,杨杰,等.基于MLR–SARIMA模型的土石坝位移预测[J].工程科学与技术,2019,51(2):108–114. doi: 10.15961/j.jsuese.201800341

    Li Bin,Hu Dexiu,Yang Jie,et al.Displacement prediction of earth dam based on MLR–SARIMA model[J].Advanced Engineering Sciences,2019,51(2):108–114 doi: 10.15961/j.jsuese.201800341
    [21] Salazar F,Morán R,Toledo M Á,et al.Data-based models for the prediction of dam behaviour:A review and some methodological considerations[J].Archives of Computational Methods in Engineering,2017,24(1):1–21. doi: 10.1007/s11831-015-9157-9
    [22] Ye X W,Xi P S,Su Y H,et al.Stochastic characterization of wind field characteristics of an arch bridge instrumented with structural health monitoring system[J].Structural Safety,2018,71:47–56. doi: 10.1016/j.strusafe.2017.11.003
    [23] 李广春,戴吾蛟,杨国祥,等.时空自回归模型在大坝变形分析中的应用[J].武汉大学学报(信息科学版),2015,40(7):877–881. doi: 10.13203/j.whugis20130549

    Li Guangchun,Dai Wujiao,Yang Guoxiang,et al.Application of space-time auto-regressive model in dam deformation analysis[J].Geomatics and Information Science of Wuhan University,2015,40(7):877–881 doi: 10.13203/j.whugis20130549
    [24] Pan C D,Yu L,Liu H L,Chen Z P,et al.Moving force identification based on redundant concatenated dictionary and weighted l1-norm regularization[J].Mechanical Systems and Signal Processing,2018,98:32–49. doi: 10.1016/j.ymssp.2017.04.032
    [25] Yang Li,Xu Feiyun.A novel acoustic emission sources localization and identification method in metallic plates based on stacked denoising autoencoders[J].IEEE Access,2020,8:141123–141142. doi: 10.1109/ACCESS.2020.3012521
    [26] Prakash G,Sadhu A,Narasimhan S,et al.Initial service life data towards structural health monitoring of a concrete arch dam[J].Structural Control and Health Monitoring,2018,25(1):e2036. doi: 10.1002/stc.2036
    [27] Chen Wenlong,Wang Xiaoling,Tong Dawei,et al.Dynamic early-warning model of dam deformation based on deep learning and fusion of spatiotemporal features[J].Knowledge-Based Systems,2021,233:107537. doi: 10.1016/j.knosys.2021.107537
图(10)  /  表(2)

本文结构

    /

    返回文章
    返回