以下为《电能表批次故障预测模型设计方案V2.1yjb》的无排版文字预览,完整格式请下载
下载前请仔细阅读文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。
电能表批次故障预测模型设计方案V2.0
研究目标
通过对电能表拆回分拣数据、运行批次数据和计量异常等数据进行分析,构建批次故障预测模型,对电能表运行批次故障数量进行预测,辅助电能表批次故障预告警研判,为营销电能表失准更换业务提供参考依据。
构建思路
电能表批次故障预测模型利用拆回分拣、运行批次、计量异常等数据,分析历史月度电能表批次故障数量的周期性、季节性和趋势性的变化规律以及影响批次故障数量变化的因素,形成模型输入的特征指标,构建多模型融合多指标输入的批次故障预测模型。本着“好而不同”的模型融合准则,经过模型训练对均方误差和拟合优度评估获得最优模型参数和模型组合,运用最优模型组合预测未来月份的批次故障数量。根据月度批次故障预测数量计算月度批次故障率,绘制故障率趋势曲线,通过故障率趋势变化得到故障率趋势拐点。专家可根据故障率趋势拐点进行批次故障预告警研判,并跟踪月度拆回电能表分拣故障数量与批次故障预测数量的差异,持续优化模型。具体实现步骤包括:
1)从运行批次故障数据中提取影响批次故障数量的特征指标;
2)构建运行批次故障预测模型;
3)实现运行批次月度故障数量预测;
4)模型验证与优化。
理论基础
针对构建电能表批次故障预测模型,通过使用统计学方法,结合机器学习、大数据相关技术对电能表批次故障实现回归预测。常用回归预测方法包括:线性回归、支持向某某(SVM)、长短期记忆人工神经网络(LSTM)、贝叶斯方法、梯度提升树(GBDT)、移动平均自回归(ARIMA)等。鉴于电能表批次故障数据存在有效数据样本量少、外部环境特征难获取、样本特征多但关系不明确等特点,而梯度提升树(GBDT)和移动平均自回归(ARIMA)可以很好解决该类问题,最终确定使用梯度提升树(GBDT)和移动平均自回归(ARIMA)两种模型,关键技术如下:
梯度提升树
梯度提升树(GBDT)是以决策树为基学习器,通过前向分布算法不断进行迭代,逐步学习得到强学习器
??
??
??
。其构建流程主要分为三步:
其一,初始化弱学习器
??
0
??
=
arg
??????
??
??=1
??
??
??
??
, ??
??∈
??
????
(3.1)
其二、针对每一次迭代,计算负梯度
r
????
=
?[
?L(
??
??
,f(
x
??
)))
?f(
x
??
)
]
f(x)=
f
???1
(x)
(3.2)
利用样本数据
(??
??
,
??
????
)(??=1,2,…??),拟合一颗CART回归树,直至得到第??颗回归树,其对应的叶子结点区域
??
????
,??=1,2,…,??,其中??为回归树??的叶子节点的个数,计算最佳拟和。
??
????
=
arg
??????
??
??
??
∈
??
????
??(
??
??
,
??
???1
??
??
+??)
(3.3)
其三、更新学习器直至获取强学习器。
??
????
=
arg
??????
??
??
??
∈
??
????
??(
??
??
,
??
???1
??
??
+??)
(3.4)
移动平均自回归
移动平均自回归模型(ARIMA),其特点是针对预测对象随时间转移,能够实现较好的预测结果。其中在ARIMA(p,d,q)中,AR为自回归,p为自回归项数;MA为滑动平均,q为滑动平均项数,d为使之成为平稳序列所做的差分阶数。可以表示为;
(1?
??=1
? 内容过长,仅展示头部和尾部部分文字预览,全文请查看图片预览。 据价值或者更基本的方式对预测进行定期修补、自更新,实现预测模型算法价值的最大化。
模型应用
电能表批次故障预警业务中,通过对运行批次(新装一年内不纳入)电能表拆回故障率和误差失准率进行实时监控,生成故障预告警批次清单,利用批次故障预测模型输出的结果(批次故障率趋势、拐点区间)和辅助信息对预告警批次开展研判,从而确定故障更换清单,推送至营销系统。
业务流程如下图7-1所示:
/
图7-1 批次故障预警业务流程
目前存在的问题
1)存在部分运行批次历史月度故障数量较少,随机性较强,影响趋势性特征提取;
2)针对指标数据涉及维度多、涵盖面广,但多指标之间可能会存在共线性问题,影响模型拟合优度。
[文章尾部最后300字内容到此结束,中间部分内容请查看底下的图片预览]
以上为《电能表批次故障预测模型设计方案V2.1yjb》的无排版文字预览,完整格式请下载
下载前请仔细阅读上面文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。