工程科学与技术   2020, Vol. 52 Issue (4): 56-65
基于改进AP聚类与优化GRNN的非侵入式负荷分解研究
汪繁荣1,2, 向  堃1, 刘辉1     
1. 湖北工业大学 太阳能高效利用及储能运行控制湖北省重点实验室,湖北 武汉 430068;
2. 无锡风繁伟业科技有限公司,江苏 无锡 214171
基金项目: 国家自然科学基金项目(41601394)
摘要: 泛在电力物联网的提出推动了智慧用电、负荷监测等技术的大力发展,为解决传统非侵入式负荷监测与分解方法耗时长、辨识精度低等问题,提出了一种通过半监督学习聚类数据建立特征集并结合果蝇优化广义回归神经网络模型的负荷分解方法。首先,该方法利用输入的设备有功功率和电流数据采取半监督学习优化相似矩阵,以近邻传播聚类算法为基础挖掘出用电设备的运行状态特性及功率信息,再使用数字编码方式将设备运行状态表示为分类标签;然后,输入总有功功率、无功功率以及电流的时间序列数据和对应序列的分类标签矩阵,利用果蝇优化算法的寻优能力求得广义回归神经网络模型的最优Spread值完成模型优化和训练;随后,输入测试时间序列数据,得到分类矩阵即各设备运行状态,并利用设备运行状态对应的功率信息进行总有功功率重构拟合,完成负荷分解。经仿真对比,该方法对所有用电设备运行状态辨识准确率达到86%左右,对单个用电设备运行状态辨识准确率达到96%左右,且耗时较短,显著提高了对负荷特性信息的挖掘能力和分解辨识能力。
关键词: 非侵入式负荷分解与监测    半监督近邻传播聚类    果蝇优化算法    广义回归神经网络    
Research on Non-intrusive Load Decomposition Based on Improved AP Clustering and Optimized GRNN
WANG Fanrong1,2, XIANG Kun1, LIU Hui1     
1. Hubei Key Lab. for High-efficiency Utilization of Solar Energy and Operation Control of Energy Storage System, Hubei Univ. of Technol., Wuhan 430068, China;
2. Wuxi Fengfan Weiye Technol. Co., Ltd., Wuxi 214171, China
Abstract: The proposal of Electrical Internet of Things (EloT) has promoted the rapid development of smart electricity and load monitoring. In order to solve the problems that traditional non-intrusive load monitoring and decomposition (NILMD) is very time-consuming and has low identification accuracy, the semi-supervised learning (SSL) was used to cluster data and then establish characteristic data set, combined with load decomposition of fruit fly optimization algorithm with generalized regression neural network (FOA–GRNN). First, with the input of active power and current data, the similarity matrix was optimized with the method of semi-supervised learning. The operating state and power information of the electrical equipment were mined based on affinity propagation clustering. Then the operating state was represented as classification label with digital coding. Second, the time series data of the total active power, reactive power and current as well as the classification label matrix of the corresponding series were all input. To complete the model optimization and training, the optimal Spread value of the generalized regression neural network (GRNN) was obtained by using the optimization ability of the fruit fly optimization algorithm (FOA). Subsequently, the test time series data was input to obtain the classification matrix, that is, the operating status of each device, whose corresponding power information was utilized to reconstruct and fit the total active power in a way to complete the load decomposition. Through simulation comparison, the identification accuracy of the operating status of all electrical equipment is about 86% and that of single electrical equipment is about 96%. The proposed method is not time-consuming and significantly improves the mining ability and decomposition identification ability of load characteristics information.
Key words: non-intrusive load decomposition and monitoring    semi-supervised affinity propagation clustering    fruit fly optimization algorithm    generalized regression neural network    

随着智能电网的萌芽和发展,节能与经济、环境的可持续发展直接相关[1]。非侵入式电力负荷监测与分解(non-intrusive load monitoring and decomposition,NILMD)是以负荷关口的“软计算”代替近设备“硬测量”的一种方法,它能以经济、便捷的方式对电力负荷进行功率、电流等总量监测,便于用户和供电公司选择节能计划。

20世纪90年代,Hart[2]提出非侵入式负荷分解,当时被称为非侵入式电器负荷监测。在中国,虽然对NILMD技术研究时间起步较晚,但发展非常迅速。2009年,黎鹏[3]首次提出非侵入式负荷分解概念,给出一种全新的电力负荷能耗监测方法。牛卢璐[4]提出一种基于双边CUSUM的暂态特征的非侵入式负荷监测方法,然而该方法对信息收集设备要求较高,不利于实际运用。林锦波[5]在聚类融合的基础上,进行负荷类别的辨识,同时构建对应的负荷曲线分类深度学习的模型,效果显著,但该方法计算过程繁琐,耗时较多。徐青山等[6]利用AP聚类构建用电设备特征集并结合遗传算法完成分类辨识,该方法有不错的分解效果,但由于聚类过度从而挖掘出的设备运行状态信息与实际不太相符,导致辨识准确率一般。周晨轶[7]提出使用神经网络模式识别模型进行负荷识别,该方法有好的辨识效果,但模型输入数据计算量大,处理麻烦,导致负荷分解耗时过久,准确率降低。

由于家用电设备种类丰富而且各用电器运行状态具有多样性,为避免聚类过细导致用电设备运行状态与实际不符,本文提出基于半监督的近邻传播聚类(semi-supervised affinity propagation,SAP)负荷特征集结合果蝇优化广义回归神经网络(fruit fly optimization algorithm with generalized regression neural network,FOA–GRNN)的非侵入式负荷分解与监测方法(SAP–FOA–GRNN)。SAP聚类能够帮助建立鲁棒性更高、更符合实际的设备运行状态矩阵,FOA–GRNN模型在分类方面有更快、更准确的辨识能力。本文利用AMPds数据集某用户典型月中6个用电设备的用电数据进行了验证。

1 NILMD基本框架

非侵入式电力负荷监测与分解流程图如图1所示,大致分为6个主要步骤:

图1 非侵入式电力负荷分解流程 Fig. 1 Non-invasive power load decomposition process

1)数据采集。通过在电力系统入口处安装测量装置,对整个系统的电压、电流和功率等电气参数进行采集。

2)事件检测及记录。用相应算法对电流或电压进行预处理,对系统内负荷的投切状态进行识别,记录事件,分辨出系统是处于稳态还是暂态过程。

3)负荷特征提取。用相应模型或算法对系统的稳态过程和暂态过程分别选取不同的特征量进行提取,特征量要具有典型性和区分度。

4)负荷分解。通过前面采集到的负荷数据及针对稳态过程和暂态过程提取出的特征量,分别通过不同的算法对负荷特征加以识别,识别出用电器种类及运行状态。

5)结果应用。准确地显示用户实时用电设备的电能消耗和运行状况,辅助电网实时地了解各类用户实际的电量消耗。

6)大数据库。包括负荷特征数据库,建立包含系统内各用电设备用电特性的负荷特征空间,作为以后输入数据的对应标签。

2 负荷特征分析

不同的用电设备具有不同的运行模式和负荷特征。负荷特征是确定负荷设备运行状态的重要指标,也是实现NIMLD的关键。用电设备负荷主要分为两种,即线性(阻性)与非线性(容性和感性)[8]。与之相关的负荷特征可以分为稳态特征、暂态特征以及非传统特征[9]。稳态特征主要包括有功功率、无功功率、电流电压、V–I轨迹、电流谐波等[10];暂态特性主要与电流信号曲线密切相关,特别是用电设备开启瞬间的信息,几乎可以作为用电设备唯一的标签[11],但是暂态特征的捕获需要通过高速A/D采样得到[12],这对于硬件的要求较为严格。根据稳态特征的不同,负荷类型可以分为3类,即开/关(ON/OFF)二状态设备、有限多状态设备(finite state machine,FSM)、连续变状态设备(continuously variable devices,CVD)[13]。如图2所示,前两类负荷类型由于不同状态的稳态特征明显不同,所以很好区分,图2P为发生状态变化时的有功功率。第3类负荷类型由于其状态变化极其复杂,所以一般用随机得到的有限个变化状态进行简化。

图2 二状态及有限多状态设备的状态变化 Fig. 2 State changes of two-state and finite multi-state equipment

本文利用稳态有功功率、无功功率以及电流作为非侵入式负荷分解的负荷特征的决定因素,对该用户的典型月里的用电信息使用聚类方法将其划分为若干不同的运行状态。图3为AMPds数据集中某用户某天6种典型家用电器(洗衣机、洗碗机、空调、电子设备、冰箱、电视)的有功功率波形。

图3 典型用电设备功率波形 Fig. 3 Typical electrical equipment power waveform

2.1 AP聚类算法

近邻传播(affinity propagation,AP)聚类是由Frey 和Dueck[14]于2007年提出的一种聚类方法,该算法已经被证实效果好于K–Means算法,该算法不需要事先指定聚类数目,而是根据n个数据对象之间的相似度进行聚类。近邻传播结束时, ${X_i}$ 的聚类中心确定为 ${X_k}$ ,其中, ${\textit k}$ 满足公式如下[15]

$k = \mathop {\arg \max }\limits_k \{ a(i,k) + r(i,k)\} $ (1)

式中: $\mathop {\arg \max }\limits_k $ 为求取函数值最大的自变量,即 $k$ 为满足 $\{ a(i,k) + r(i,k)\} $ 取得最大值时的取值; $r(i,k)$ $k$ 点是否适合作为 $i$ 点的聚类中心,即 $i$ $k$ 吸引度; $a(i,k)$ $i$ 点是否选择 $k$ 作为其聚类中心,即 $k$ $i$ 的归属度[16]

AP聚类算法的一般步骤如下[14]

1)已知数据集 $X = \left\{ {{X_{\rm{1}}},{X_{\rm{2}}}, \cdots ,{X_n}} \right\}$ ,选用负的欧氏距离的平方来计算相似度并构建相似度矩阵 ${{{S}}_{n \times n}}$ ,对应参考度(偏向参数) $p$ 为相似度矩阵S的中值。

2)计算吸引度和归属度,如式(2)、(3)所示,初始状态时 $r$ $a$ 取值为0。

$r(i,k) = s(i,k) - \mathop {\max }\limits_{k' \ne k} \left\{ {a(i,k') + s(i,k')} \right\}$ (2)
$\begin{aligned}[b] & a(i,k) = \\ &\left\{\!\!\!\! {\begin{array}{*{20}{l}} {\min \bigg\{ {0,r(k,k) + \displaystyle\sum\limits_{i' \notin \left\{ {i,k} \right\}} {\max \left\{ {0,r(i',k)} \right\}} } \bigg\},i \ne k;} \\ {\displaystyle\sum\limits_{i' \ne k} {\max \left\{ {0,r(i',k)} \right\},i = k} } \end{array}} \right. \end{aligned} $ (3)

3)为了使算法在迭代过程中避免震荡,在每次迭代更新时加入阻尼系数 $\lambda \left( {\lambda \in \left( {0,1} \right)} \right)$ 调节算法收敛速度,更新公式如下:

${r_{t + 1}}(i,k) = \lambda \cdot {r_t}(i,k) + (1 - \lambda ) \cdot {r_{t + 1}}(i,k)$ (4)
${a_{t + {\rm{1}}}}(i,k) = \lambda \cdot {a_t}(i,k) + (1 - \lambda ) \cdot {a_{t + 1}}(i,k)$ (5)

4)迭代执行步骤2)和3),更新 ${\textit{r}}(i,k)$ ,利用迭代后的 $r$ 更新 $a(i,k)$ ;然后,得到H个聚类中心点,并据此划分出H个聚类。

2.2 改进AP聚类算法

由于使用传统AP聚类方法对数据进行分类时可能造成分类过精细等情况,所以本文对其进行改进,加入半监督学习(SAP),通过更多约束信息来扩展和更新相似矩阵[17]。在传统AP聚类过程中,相似矩阵S形成后将不会再次发生改变,其反映了数据特性的内在关系。SAP聚类先利用部分数据样本形成约束信息进行逻辑扩展及挖掘;然后,将更多样本的特征信息更新到相似矩阵S,实质上是对相似矩阵的预处理,使相似矩阵S能够更加准确地反映数据特性,并使聚类结果更符合实际,避免过精细。SAP聚类的逻辑扩展为:

$\begin{aligned}[b] ({x_i},{x_k}) \in M \; \& \; ({x_j},{x_k}) \in M \Rightarrow {\rm{ (}}{x_i},{x_j}) \in M \end{aligned}$ (6)
$\begin{aligned}[b] ({x_i},{x_j})\! \notin \! \left\{ {M \cup C} \right\} \& ({x_i},{x_k}) \in M \& ({x_j},{x_k}) \! \in \! C \Rightarrow ({x_i},{x_j}) \in C \\ \end{aligned} $ (7)

式中:集合 $M = \left\{ {\left( {{x_i},{x_j}} \right)} \right\}$ 表示must-link规定的两个点属于同一类;集合 $C = \left\{ {\left( {{x_i},{x_j}} \right)} \right\}$ 表示cannot-link规定的两个点不属于同一类。must-link和cannot-link是两种成对点约束[17]。逻辑扩展能够使研究者挖掘出原数据中must-link和cannot-link的隐藏逻辑关系。定义同类数据点间相似度为0,不同类数据点间相似度为负无穷,否则,取相似度为最大值,定义公式如下:

$\begin{aligned}[b] ({x_i},{x_j}) \in C \Rightarrow S(i,j) = {\rm{ }} - \infty \; \& \;S(j,i) = - \infty \\ \end{aligned} $ (8)
$\begin{aligned}[b] ({x_i},{x_j}) \in M \Rightarrow S(i,j) = {\rm{ }}0\; \& \;S(j,i) = 0 \\ \end{aligned} $ (9)
$\begin{aligned}[b] ({x_i},{x_k}) \notin \left\{ {M \cup C} \right\} \Rightarrow S(i,j) = {\rm{ }}\max \left\{ {S(i,j),S(i,k) + S(k,j)} \right\} \\ \end{aligned} $ (10)

改进算法中,先利用式(6)~(10)更新相似度矩阵S,然后执行AP聚类步骤完成聚类。另外为验证改进算法效果,本文使用Fowlkes–Mallows(FM)指数对聚类结果进行评价,用 ${V_{{\rm{FM}}}}$ 表示,其为准确率和召回率的几何平均值:

${V_{{\rm{FM}}}} = \frac{{{V_{{\rm{TP}}}}}}{{\sqrt {({V_{{\rm{TP}}}} + {V_{{\rm{FP}}}})(V_{{\rm{TP}}}^{} + {V_{{\rm{FN}}}})} }}$ (11)

式中, ${V_{{\rm{TP}}}}$ 为真实标签与预测标签相同簇的点组数, ${V_{{\rm{FP}}}}$ 为真实标签属于同类而不在预测标签中的组数, ${V_{{\rm{FN}}}}$ 为预测标签同类而不在真实标签中的组数。 ${V_{{\rm{FM}}}}$ 为0~1之间的数,越靠近1表示相似度越高,聚类效果越好。

2.3 基于半监督近邻传播聚类的负荷特征集

与K–means和模糊C均值(fuzzy C–Means,FCM)聚类算法相比,AP聚类不需要事先确定聚类数目,且可调参数较少,大大降低了人为因素的干扰,而且SAP聚类在AP聚类的基础上引入了半监督学习,所以使得聚类结果更加准确。本文采用半监督近邻传播算法对AMPds数据集中某用户6个典型用电设备的有功功率分布、无功功率分布以及电流分布进行聚类,算法的输入为2维向量,因此每次只取其中两个因素进行聚类,然后根据聚类结果对各设备的用电模式进行区分,用电设备的聚类数目为该设备运行状态的数目。这样就能明确在某采样点时刻用电设备所对应的运行状态,从而为后续的负荷分解奠定基础,简化计算。SAP聚类算法流程图如图4所示。

图4 SAP聚类算法流程图 Fig. 4 Flow chart of SAP clustering algorithm

3 基于SAP聚类的FOA–GRNN负荷分解方法 3.1 FOA优化GRNN参数

果蝇优化算法(fruit fly optimization algorithm,FOA)是一种基于果蝇觅食行为推演寻求全局优化的新方法[18]。广义回归神经网络(generalized regression neural network,GRNN)是一种径向基神经网络,GRNN具有很强的非线性映射能力和柔性网络结构以及高容错性和鲁棒性,计算速度也很快,适用于解决非线性问题[19]。本文将FOA和GRNN相结合,利用FOA的寻优能力寻找GRNN最优的Spread值(即GRNN模型中的平滑参数,其值影响模型分类结果),使得分类性能更好。FOA寻优GRNN参数的流程如图5所示。

图5 FOA寻优GRNN参数流程图 Fig. 5 Flow chart of GRNN model parameters optimized by FOA

图5中,主要涉及的计算公式为:

$D = \sqrt {{X^2} + {Y^2}} $ (12)

式中,点 $(X,Y)$ 为种群初始位置。

$A = \frac{1}{D}$ (13)
${B_{{\rm{Smell}}}} = {F_1}{\rm{(}}A{\rm{)}}$ (14)

式中, ${F_1}$ 为味道浓度判定函数,即目标函数。本文的目标是网络输出与目标值误差最小,也就是分类准确率最大,即将GRNN中的Spread参数视为种群个体,寻找最优的Spread值以达到目标;然后,将最优Spread值用于原GRNN模型,优化分类效果。

3.2 GRNN模型

NILMD问题的求解目标是通过总的电流、功率等信息辨识出各用电设备的运行状态,基于功率和电流特征的负荷分解模型可以近似描述为[20]

${P_{\rm{L}}}(n) = \sum\limits_{a = 1}^N {\sum\limits_{b = 1}^{M(a)} {{R_{a{\rm{,}}b}}} } (n) \cdot {P_{a{\rm{,}}b}}(n) + e(n)$ (15)
${Q_{\rm{L}}}(n) = \sum\limits_{a = 1}^N {\sum\limits_{b = 1}^{M(a)} {{R_{a{\rm{,}}b}}} } (n) \cdot {Q_{a{\rm{,}}b}}(n) + e(n)$ (16)
${I_{\rm{L}}}(n) = \sum\limits_{a = 1}^N {\sum\limits_{b = 1}^{M(a)} {{R_{a{\rm{,}}b}}} } (n) \cdot {I_{a{\rm{,}}b}}(n) + e(n)$ (17)

式中: ${P_{\rm L}}(n)$ ${Q_{\rm{L}}}(n)$ ${I_{\rm{L}}}(n)$ 为第 $n$ 个采样点总有功功率、总无用功率以及总电流; $N$ 为用电设备总数; $M(a)$ 为用电设备 $a$ 的运行状态总数, $M(a) \in \left\{ {0,1,2,3, \cdots } \right\}$ ${R_{a{\rm{,}}b}}\left( n \right)$ 为在第 $n$ 个采样点时用电设备 $a$ 处于运行状态 $b$ 的数字编码( $R < 6$ ); ${P_{a{\rm{,}}b}}(n)$ ${Q_{a{\rm{,}}b}}(n)$ ${I_{a{\rm{,}}b}}(n)$ 分别为在第 $n$ 个采样点时用电设备 $a$ 在运行状态 $b$ 的有功功率、无功功率以及电流; $e(n)$ 为误差。

GRNN由输入层、隐藏层、求和层和输出层组成,其网络结构如图6所示。

图6 GRNN网络结构 Fig. 6 GRNN network structure

图6中: $\displaystyle\sum F $ 表示函数运算;输入层将线性函数作为传输函数,样本个数为m,每个样本维度是n;隐藏层将传输径向基函数作为传输函数且神经元个数与样本个数相等;求和层中有两个节点,一个节点是每个隐含层节点的输出和,另一个是每个隐含层节点与预期结果之间的加权和;输出层输出的是第2个节点除以第1个节点的值,输出可以是列向量也可以是矩阵。

3.3 SAP聚类与FOA–GRNN模型的结合方法

非侵入式负荷分解可以看作是对总有功功率等数据的分类问题。本文提出了一种SAP聚类算法与FOA–GRNN模型相结合的非侵入式负荷分解方法(SAP–FOA–GRNN)。首先,本文利用SAP聚类,以用电设备有功功率和电流数据为因素条件进行聚类,挖掘各设备运行状态数量,得到不同采样点时刻各用电设备对应的运行标签,即某采样点时刻采集到的一个用电设备的有功功率、无功功率和电流的值会对应该用电设备的一个运行状态,这样每个采样点采集的总有功功率、总无功功率以及总电流便对应一个运行状态序列,由于有多个采样点,这样便生成了状态矩阵。然后,将状态矩阵作为FOA–GRNN模型的输出层数据。由于各用电设备在不同工作状态下的稳态特性都不相同,所以将总的有功功率、无功功率以及电流作为FOA–GRNN模型的输入层,输入矩阵由3个m行的列向量组成,由于有6个用电设备,所以输出矩阵为6个m行的列向量,输出矩阵的每一行则代表每个采样点时刻各用电器运行状态,各用电设备运行状态编码,如表1所示。

表1 输出层定义 Tab. 1 Output layer definition

表1可知,若有m个采样点,各设备运行状态编码中,数字0表示该设备在该采样点时刻未运行,数字大于0则表示该设备在该采样点时刻处于与数字对应的运行状态,编码数字无实际意义。

利用FOA–GRNN模型分类时包含训练和测试两个部分。将采集到的总有功功率、无功功率以及电流作为输入,设备状态矩阵作为输出;经过训练后,再将测试数据输入训练好的模型,根据输出便可知道负荷分解结果;最后,可以通过各用电设备负荷信息进行总有功功率的拟合。

4 实例分析

AMPds数据[21]为加拿大某居民2年中各用电器用电情况的数据集。本文使用的数据只涉及有功功率、无功功率、电流这3种数据,每分钟采集一次,选取该居民典型月的用电数据,并选取图3所示的洗衣机、洗碗机、空调、电子设备、冰箱和电视6种主要用电设备,进行用电设备运行状态和负荷信息的挖掘,并基于挖掘信息数据对设备进行负荷辨识及各设备有功功率拟合。

4.1 各用电设备运行状态及负荷信息的挖掘

首先,SAP聚类目的是挖掘用电设备运行状态的数量及对应负荷信息,以判定采样点时刻用电设备处于的运行状态。由于6种主要用电设备中电子设备运行模式单一且功率波动幅度不大,为了简化计算提高聚类效率,将电子设备运行状态和相应负荷信息默认为给定,所以只对除电子设备外的其余5种用电器的运行数据进行聚类,挖掘出设备运行状态及对应负荷信息。聚类数目就是用电设备运行状态的数目。在建立特征集时,考虑有功功率分布和电流分布(PI)因素为聚类指标、有功功率分布和无功功率分布(PQ)因素为聚类指标,使用AP聚类和SAP聚类两种算法进行对比。以洗碗机为例,两种聚类算法的最大迭代次数为1 000,收敛限度为100,阻尼系数为0.9,图7为洗碗机在两组指标下SAP聚类的结果,图8为洗碗机在两组指标下AP聚类的结果。

图7 洗碗机SAP聚类结果 Fig. 7 SAP clustering results of dishwasher

图8 洗碗机AP聚类 Fig. 8 AP clustering results of dishwasher

PIPQ两组指标下,5种用电器使用SAP、AP算法聚类结果对比见表2。由图78表2中的VFM值可知,对于洗碗机和其他4种用电设备不管是SAP聚类还是AP聚类,在PI指标的聚类情况下都表现出更好的聚类效果。由表2PIVFM值可知:SAP聚类的效果均好于AP聚类。SAP聚类挖掘出的用电设备运行状态更符合实际情况且更稳定;AP聚类虽然能得到聚类结果,但结果过于精细,与实际情况并不相符。

表2 5种用电设备在PIPQ指标下SAP聚类与AP聚类结果对比 Tab. 2 Comparison of SAP clustering and AP clustering results of five kinds of electrical equipment under PI and PQ indicators

然后,将利用SAP聚类挖掘出的5种设备数据信息与默认的电子设备数据信息汇总,得到6种用电器的运行状态及对应负荷信息。表3为6种用电设备运行状态编号及对应负荷信息。由表3可知:因为电子设备功率波动极小,所以默认为2个运行状态;洗衣机、空调、电视有3个状态,洗碗机、冰箱有4个状态;状态编号0表示用电设备未运行,状态编号1、2、3则表示用电设备处于不同的运行状态(无实际意义,不同状态有与之对应的负荷信息);另外,有功功率与电流值是聚类后簇中心的值,这样处理可减少拟合功率时的计算量,使得后续负荷分解与辨识时的效果更好。表3中的数据是第4.2节通过分类结果拟合总功率的基础条件。

表3 6种用电器运行状态编号及相关特征信息 Tab. 3 Six kinds of electrical appliances running status number and related characteristic information

4.2 设备运行状态辨识与功率拟合

首先,利用FOA寻优GRNN模型参数,并建立FOA–GRNN模型,通过FOA–GRNN模型分类得到所有设备识别准确率,并与传统GRNN、RBF以及BP模型的结果进行对比;然后,根据FOA–GRNN模型输出的分类结果结合第4.1节表3的负荷信息进行有功功率拟合;最后,根据拟合效果同时参考之前FOA–GRNN模型的输出结果得到单个设备识别准确率,并与文献[7]中数据进行对比。

使用的负荷分解评价指标为所有设备识别准确率 ${C_{\rm R}}$ 、单个设备识别准确率 ${C_{\rm R1}}$ 以及总有功功率误差 $e$ ,计算公式如下:

${C_{\rm R}} = \frac{{\displaystyle\sum_{j} {{T_{j}}} }}{{{N_{\rm s}}}}$ (18)
${C_{\rm R1}} = \frac{{\displaystyle\sum_{i} {{T_i}} }}{{{N_{\rm s}}}}$ (19)
$ e = \frac{{\left| {{P_1} - {P_2}} \right|}}{{{P_1}}} $ (20)

式中, ${T_{j}}$ 为采样点所有设备运行情况识别正确的次数, ${T_i}$ 为采样点某一个设备运行情况识别正确的次数, ${N_{\rm s}}$ 为采样点总数, ${P_1}$ 为总实际有功功率, ${P_2}$ 为拟合总有功功率, ${C_{\rm R}}$ 反映了6个用电设备同时识别正确时的运行状态识别准确率, ${C_{\rm R1}}$ 只反映单个用电设备运行状态识别准确率, ${C_{\rm R}}$ 多数情况下小于 ${C_{\rm R1}}$ $e$ 反映算法分解后拟合效果。

在典型月的数据中,采样500组有功功率、无功功率和电流数据,每组数据即为一个采样点的数据,该500组数据尽量覆盖各用电设备的所有运行状态组合情况,其中,400组为训练组,100组为测试组。为了避免人为因素的干扰,在训练和测试中将500组数据打乱后选取训练组与测试组,测试40次,以40次的加权平均结果作为最终结果。由于每次训练组不一致,所以每次代入FOA的数据也不一样,求出的Spread值也会有一定偏差。以其中一次寻优为例,种群规模为100,迭代次数为1 000,种群初始位置区间为[0,1],种群随机飞行距离区间为[–10,10]。图9给出了FOA寻找最优目标的迭代过程,其中,RMSE为均方根误差,RMSE越接近0表示偏差越小。由图9可知,寻优过程中第590代之后RMSE趋于稳定,则表明其寻优效果良好。本次寻优的最佳Spread为0.335 2。

图9 FOA寻找最优目标迭代曲线 Fig. 9 Iterative curve of optimization by FOA

图10 所有用电设备总有功功率拟合 Fig. 10 Fitting curve of total active power of all electrical equipment

为了更好地验证本文FOA–GRNN模型的性能,本文将其与传统的GRNN模型、径向基神经网络(RBF)[19]以及反向传播神经网络(BP)模型的结果进行对比,表4为各模型部分分解结果及所有测试的加权平均结果。

表4 各算法所有设备识别准确率的部分测试次数分解结果对比 Tab. 4 Comparison of decomposition results of partial test times of all equipment recognition accuracy rates of each algorithm

表4的结果表明,本文FOA–GRNN模型具有更高的识别准确率,其对6种设备运行状态的整体识别正确率为86.475%。除了BP模型耗时较多外,其他模型的耗时均较少且相差不大,限于篇幅这里不再赘述。

NILMD的目的有两个:一是,能正确辨识用电器运行状态;二是,估算出电器在一段时间内的有功功率消耗。使用本文SAP–FOA–GRNN方法对所有设备的总有功功率、各用电器的有功功率进行拟合,结果如图1011所示。

图11 各用电器有功功率拟合 Fig. 11 Fitting curve of the active power of each appliance

图1011中,出现了若干实际有功功率与拟合有功功率差异较大的点,但是这些点的实际有功功率与拟合有功功率的趋势几乎都相同,且差异点不多,拟合效果仍是优秀的。

图12为整个采样点时间段内用电设备实际功率总和值与使用本文SAP–FOA–GRNN方法拟合功率总和值。由图12可以看出,拟合功率与实际功率较为接近。经式(20)计算可知,所有用电设备在整个采样点时段里消耗的总有功功率拟合误差e为4.15%,且拟合功率大于实际功率,这样便于制定用户用电计划,不会出现电力透支的情况。

图12 采样点时间内各用电设备及所有用电设备共消耗的实际有功功率和拟合有功功率 Fig. 12 Actual active power and fitted active power consumed by each electrical equipment and all electrical equipments in the sampling time

6个用电设备使用FOA–GRNN模型在输入层因素为PQI时所得的识别准确率,与文献[7]中使用神经网络模式识别模型(NNPR)在输入层因素为PQTPQ时得到的识别准确率数据对比,结果如表5所示。其中,PQ表示考虑有功功率与无功功率因素,PQI表示考虑有功功率、无功功率以及电流因素,PQT表示考虑有功功率、无功功率以及时间因素等。由表5可知:洗衣机、洗碗机、冰箱、空调以及电视由于各运行状态间功率差异较大,所以对其识别的准确率更高;而电子设备由于其运行状态少且功率差异不明显,所以对其识别的准确率低一些。另外,网络输入层中考虑的因素不一样也可能对负荷识别的准确率造成影响。与文献[7]中所给出的实验数据相比,除了洗碗机外,本文提出的SAP–FOA–GRNN方法对各用电设备的识别准确率更高,即本文选择的有功功率、无功功率以及电流(PQI)为因素输入FOA–GRNN模型后辨识效果更好。

表5 本文方法与文献[7]方法的各用电设备负荷识别准确率比较 Tab. 5 Comparison of the accuracy of load identification of various electrical equipment based on the algorithm in this paper and the method of reference[7]

综合表45可知:本文提出的SAP–FOA–GRNN方法具有较好的辨识效果;单个用电设备的识别准确率 ${C_{\rm R1}}$ 均高于所有用电设备运行状态的识别准确率 ${C_{\rm R}}$ 。说明即使整体辨识有误,个别设备也可能辨识正确,也就是说多个用电设备同时运行会加大负荷分解的难度,对于该情况,本文提出的SAP–FOA–GRNN方法需要进一步改进以提高其辨识准确率。

5 结 论

本文提出了一种通过半监督学习聚类数据建立特征集并结合果蝇优化广义回归神经网络模型的负荷分解方法(SAP–FOA–GRNN)。根据不同用电设备、不同运行时段的不同稳态特性,利用SAP聚类算法建立各用电设备运行状态负荷特征数据集,随后与FOA–GRNN模型相结合完成负荷分解。为了检验SAP聚类算法的性能,将其与传统AP聚类算法进行了对比,SAP聚类结果更符合实际且鲁棒性更高,因为负荷特征数据集的建立减轻了负荷分解的计算压力。另外,为了验证提出的FOA–GRNN模型的高辨识能力,将该模型与传统GRNN、RBF、BP模型进行比较,本文提出的FOA–GRNN模型有更好的辨识分类效果。综合来看,本文提出的SAP–FOA–GRNN方法有较好的负荷辨识能力及功率拟合能力。目前,智能电表应用广泛,总电流、总有功功率以及总无功功率的采集都比较方便,所以对采样设备性能要求不高,因此,本文方法适用范围较广,但是若处于多个用电器同时工作情况,本文方法的整体辨识准确率还需要通过增加因素输入、扩充特征集等方式进一步提高。

参考文献
[1]
Huang Li,Wei Zhinong,Wei Yanfang,et al. A survey on interactive system and operation patterns of intelligent power utilization[J]. Power System Technology, 2013, 37(8): 2230-2237. [黄莉,卫志农,韦延方,等. 智能用电互动体系和运营模式研究[J]. 电网技术, 2013, 37(8): 2230-2237.]
[2]
Hart G W. Nonintrusive appliance load monitoring[J]. Proceedings of the IEEE, 1992, 80(12): 1870-1891. DOI:10.1109/5.192069
[3]
Li Peng.Non-intrusive power load decomposition and monitoring[D].Tianjin:Tianjin University,2009.
黎鹏.非侵入式电力负荷分解与监测[D].天津:天津大学,2009.
[4]
Niu Lulu.Non-intrusive load monitoring based on transient process[D].Tianjin:Tianjin University,2010.
牛卢璐.基于暂态过程的非侵入式负荷监测[D].天津:天津大学,2010.
[5]
Lin Jinbo.Application research of cluster fusion and deep learning in recognition of electric load pattern[D].Guangzhou:South China University of Technology,2014.
林锦波.聚类融合与深度学习在用电负荷模式识别的应用研究[D].广州:华南理工大学,2014.
[6]
Xu Qingshan,Lou Oudie,Zheng Aixia,et al. A non-intrusive load decomposition method based on affinity propagation and genetic algorithm optimization[J]. Transactions of China Electrotechnical Society, 2018, 33(16): 3868-3878. [徐青山,娄藕蝶,郑爱霞,等. 基于近邻传播聚类和遗传优化的非侵入式负荷分解方法[J]. 电工技术学报, 2018, 33(16): 3868-3878. DOI:10.19595/j.cnki.1000-6753.tces.170894]
[7]
Zhou Chenyi.Non-intrusive load monitoring method research based on neural network pattern recognition[D].Beijing:North China Electric Power University,2017.
周晨轶.基于神经网络模式识别的非侵入式负荷监测方法研究[D].北京:华北电力大学,2017.
[8]
Qi Bing,Cheng Yuan,Wu Xin. Non-intrusive household appliance load identification method based on Fisher supervised discriminant[J]. Power System Technology, 2016, 40(8): 2484-2490. [祁兵,程媛,武昕. 基于Fisher有监督判别的非侵入式居民负荷辨识方法[J]. 电网技术, 2016, 40(8): 2484-2490. DOI:10.13335/j.1000-3673.pst.2016.08.034]
[9]
He Dawei,Du Liang,Yang Yi,et al. Front-end electronic circuit topology analysis for model-driven classification and monitoring of appliance loads in smart buildings[J]. IEEE Transactions on Smart Grid, 2012, 3(4): 2286-2293. DOI:10.1109/tsg.2012.2219327
[10]
Egarter D,Bhuvana V P,Elmenreich W. PALDi:Online load disaggregation via particle filtering[J]. IEEE Transactions on Instrumentation and Measurement, 2015, 64(2): 467-477. DOI:10.1109/tim.2014.2344373
[11]
Leeb S B,Shaw S R,Kirtley J L. Transient event detection in spectral envelope estimates for nonintrusive load monitoring[J]. IEEE Transactions on Power Delivery, 1995, 10(3): 1200-1210. DOI:10.1109/61.400897
[12]
Liang Jian,Ng S K K,Kendall G,et al. Load signature study—Part I:Basic concept,structure,and methodology[J]. IEEE Transactions on Power Delivery, 2010, 25(2): 551-560. DOI:10.1109/tpwrd.2009.2033799
[13]
Lou Oudie.Non-intrusive load feature extraction and recognition research[D].Nanjing:Southeast University,2018.
娄藕蝶.非侵入式负荷特征提取与识别研究[D].南京:东南大学,2018.
[14]
Frey B J,Dueck D. Clustering by passing messages between data points[J]. Science, 2007, 315(5814): 972-976. DOI:10.1126/science.1136800
[15]
Chu Zhuangzhuang,Liang Jun,Zhang Xu,et al. Modeling of generalized load steady-state characteristics based on affinity propagation clustering algorithm and its application[J]. Electric Power Automation Equipment, 2016, 36(3): 115-123. [褚壮壮,梁军,张旭,等. 基于仿射传播聚类算法的广义负荷稳态特性建模及其应用[J]. 电力自动化设备, 2016, 36(3): 115-123. DOI:10.16081/j.issn.1006-6047.2016.03.018]
[16]
Wang Lei,Wang Xili,Liu Gaoxia,et al. Improved adaptive affinity propagation clustering based on semi-supervised learning[J]. Application Research of Computers, 2010, 27(12): 4436-4438. [王磊,汪西莉,刘高霞,等. 一种结合半监督的改进自适应亲和传播聚类[J]. 计算机应用研究, 2010, 27(12): 4436-4438. DOI:10.3969/j.issn.1001-3695.2010.12.010]
[17]
Xiao Yu,Yu Jian. Semi-supervised clustering based on affinity propagation algorithm[J]. Journal of Software, 2008, 19(11): 2803-2813. [肖宇,于剑. 基于近邻传播算法的半监督聚类[J]. 软件学报, 2008, 19(11): 2803-2813.]
[18]
Pan J W,Pan T.A new evolutionary computation approach:Fruit fly optimization algorithm[EB/OL].[2019–12–01].https://www.scienceopen.com/document?vid=f780a215-6c07-45be-93f0-b55c65d473b2.
[19]
Specht D F. Probabilistic neural net works and the polynomial Adaline as complementary techniques for classification[J]. IEEE Transactions on Neural Networks, 1990, 1(1): 111-121. DOI:10.1109/72.80210
[20]
Yu Yixin,Liu Bo,Luan Wenpeng. Nonintrusive residential load monitoring and decomposition technology[J]. Southern Power System Technology, 2013, 7(4): 1-5. [余贻鑫,刘博,栾文鹏. 非侵入式居民电力负荷监测与分解技术[J]. 南方电网技术, 2013, 7(4): 1-5. DOI:10.3969/j.issn.1674-0629.2013.04.001]
[21]
Makonin S,Popowich F,Bartram L,et al.AMPds:A public dataset for load disaggregation and eco-feedback research[C]//Proceedings of the 2013 IEEE EIectrical Power & Energy Conference.Halifax:IEEE,2013:1–6.