基于TableGAN的电厂辅机数据挖掘与故障预警文献综述

 2023-08-24 16:46:29
  1. 文献综述(或调研报告):

风机、水泵、磨煤机等主要辅机直接影响着电厂锅炉和主机的正常运行。由于辅机制造水平较低,调节频繁,负荷变化较大,因此故障率远高于主机。据统计,国内送风机故障率为0.45次/年,非计划停运率为0.06%;引风机故障率为1.11次/年,非计划停运率为0.1%,给水泵故障率达到6.04次/年,非计划停运率为0.66%,而磨煤机的故障率更是比风机和水泵都要高。与此同时,电厂对于辅机系统重视不足,很多还停留在定期巡检、停机检修及事后故障分析的低层次阶段。

传统的检测方式在面对风机、水泵等结构复杂的多激励源的旋转机构时,难以进行有效的判断,更难以对故障进行预测,只能在故障发生后诊断故障现象。因此为了提高电厂的管理效率以及改善主机的利用效率,将人工智能技术引入智慧电厂的建设中,以提高机组监测和诊断水平是十分必要的。

进行机器学习训练的过程中很容易出现的一个问题就是“过拟合”问题,即模型系统中的复杂参数只能捕捉到训练样本中十分具体的随机变量,导致系统实际判断过程中准确率下降。造成“过拟合”现象主要是训练样本过少导致的,而手动标记出训练样本又十分费时费力,因此常常只能依靠模型生成训练样本。

2014年Goodfellow等人提出了著名的生成式对抗网络模型,即GAN模型,其被誉为“过去十年间,机器学习领域最让人激动的点子”,很好的解决了生成合理的训练样本的困难。生成式对抗网络由一个生成器G和一个判别器D构成,其中生成器G负责通过随机噪声Z生成样本,而判别器D负责判断生成器G生成的样本是否为真实样本。在训练过程中,生成器G与判别器D不断相互对抗,生成器G不断提高自己的生成能力,使得生成样本更加接近真实样本;同时判别器D不断提升自身判断样本是否为真实样本的能力。当训练至生成器和判断器的能力都不再提升时,就说明了该生成式对抗网络已经达到了训练极限,其产生的模型就是一个比较完美的模型。

TableGAN是在以GAN为基础改善的用于结构化数据表的模型,它修改了优化函数,增加了模型的稳定性,同时在生成器和判别器模型中添加了正则化项,减小了噪声对模型稳定的影响,还增加了输入噪声的多样性,防止了模式崩溃(模型生成的样本过于单一)的发生。宋珂慧、张莹等人也在实验中成功的证明了TableGAN能够生成出高质量的合成数据,改善机器的训练结果。

除了使用可以生成更多训练样本的模型,在实际训练过程中的算法也有很多种。张维等人提出了结合模糊推理和滑动平均相似度的算法;陈建平等人提出了GRL强化学习算法;肖黎等人则采用了基于密度的有噪声聚类算法(DBSCAN)和随机森林算法(RF)。以上几种算法均可以提高最终的训练成果。

[1] Kingma D P,Welling M.Auto-encoding variational Bayes[J].arXiv preprint arXiv:1312.6114,2013

[2] Mnih V,Susskind J M,Hinton G E.Modeling natural images using gated MRFs[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2013,35(9):2206-2222

[3] Odena A,Olah C,Shlens J.Conditional image synthesis with auxiliary classifier gans [J].arXiv preprint arXiv:1610.09585,2016

[4] Tay Y.Data generation for application-specific benchmarking [c]//Proc of the 37th Int Conf on Very Large Data Bases (VLDB).New York:ACM,2011:1470-1473

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。