扫码关注艾尼科微信公众号

当静电除尘器遇上随机森林:用机器学习做ESP故障诊断

基于EPRI与DTE Energy在第17届静电除尘国际会议上的FoREMaL Explorer研究解读

关键词
Electrostatic precipitator (ESP), coal-fired furnace, Machine Learning (ML), Random Forests (RF), 不透明度监测, 电厂智慧运维

近年来,人工智能在电力及环保行业的渗透速度远超预期,从锅炉燃烧优化、脱硝控制,到汞排放预测,AI正像百年前电气化那样重塑传统电厂的运行方式。在这一波浪潮中,“静电除尘器(ESP)+机器学习”正在从概念探索走向可落地应用,尤其是在现场长期困扰运维人员的故障诊断和性能劣化问题上。本期聚焦于EPRI(美国电力研究院)、DTE Energy与美国奥克兰大学联合在第17届静电除尘国际会议(ICESP 2024)上发布的一项研究:利用随机森林(Random Forest,RF)及其扩展算法“Forest of Forests(FoF)”对大型燃煤机组冷端ESP进行故障排查,并开发出桌面分析工具FoREMaL Explorer,为ESP运维提供数据驱动的决策辅助。

该研究由Jose Sanchez(EPRI)、Tony Bazzi(DTE Energy)和Mohamed Zohdy(Oakland University)等完成,针对一台装机容量约640 MWg的燃煤机组,利用机器学习对电除尘器控制系统和烟气工况进行系统性建模,重点分析排放端不透明度(Opacity)异常升高问题,并验证随机森林在多变量复杂工况下的诊断能力。

从行业研究脉络看,电力行业的AI应用最早集中在气态污染物建模,如采用广义回归神经网络(GE-GRNN)预测锅炉NOx排放与燃烧效率[1],或用PCA、K-means、SVM等方法预测选择性催化还原(SCR)工况下空预器的硫酸氢铵(ABS)结晶温度[2],也有将神经网络与遗传算法结合,实现锅炉NOx排放与效率双目标优化的探索[3]。相比之下,本次工作把目光转向颗粒物控制系统,利用随机森林这一兼顾可解释性与精度的机器学习算法,为ESP运行诊断提供“变量重要性排序+灵敏度分析+操作建议清单”的一体化解决思路。

技术上,该研究选用的核心算法为随机森林回归模型。随机森林属于集成学习中的监督学习方法,通过对原始数据进行自助采样(bootstrap),构建多棵决策树并进行袋装(bagging)平均来降低方差。相较于单棵决策树,随机森林对异常点更鲁棒,且在高维多特征数据集上表现稳定,而其基于树分裂节点的“变量重要性”度量,也为ESP过程分析提供了直观的解释途径。作者在研究中重点使用了两类重要性评估方法:基于方差最大减小(mean decrease in impurity)以及输入扰动法(input perturbation),相关偏差问题与改进思路则参考了Strobl等人对随机森林变量重要性的系统研究[5]以及Estes在除尘诊断中的经验[6]。

在此基础上,团队提出了一个更进一步的“Forest of Forests(FoF)”概念,即在随机森林之上再做一层集成:首先将原始数据随机打乱,分割为多个小批次数据集,每个小批次单独训练一套随机森林模型,然后再将各个森林输出的变量重要性结果进行聚合。通过“分而治之”的方式,FoF试图在偏差与方差之间取得更优平衡,提高特征排序的稳健性,减小单一模型可能带来的过拟合风险。这一方法此前已在电厂空气质量控制系统分析中有过初步应用[7,8],本次则进一步扩展到ESP性能诊断场景。

为了让这一算法真正服务于一线运维,该团队将RF/FoF建模能力集成到Windows桌面程序FoREMaL Explorer中。该软件以DCS历史数据CSV文件为输入,内置数据预处理(缺失值、异常值与相对标准偏差筛选)、行列过滤、模型超参数设置、模型训练与验证以及结果可视化与Action List生成等功能。模型开发阶段通常需要数据科学工程师配合ESP工艺专家共同参与,以确定合理的特征集合与目标变量,后续则可以将成熟模型打包为“场站专用诊断模板”,供现场工程师和值长快速调用。

在典型案例中,研究对象为一台配备四室冷端ESP的640 MWg燃煤机组,锅炉采用对冲布置、平衡通风,燃用多种烟煤与次烟煤混合煤。ESP共有四个腔室,每室沿烟气流向布置六电场,总比集面积约669 ft²/kacfm,二次侧设计电压电流为50 kV/2500 mA,配套Forry控制系统。ESP后布置四台引风机(IDF),入口设有可调叶片导叶(Inlet Damper),四个ESP出口经平衡风道汇入公共烟道后进入烟囱。现场问题表现为在约10天时间窗口内,机组烟囱排放不透明度基线明显抬升,从约1%飙升至8.5%左右,虽仍低于20%的合规红线,但已经迫使机组在部分时段降负荷运行以规避超标风险。

数据层面,研究团队从DCS历史数据库中提取了约300个过程参数(tags)作为模型输入特征,涵盖机组有功负荷、各TR-Set二次电压电流、放电频率(spark rate)、可控硅触发角、四台IDF电机电流与导叶开度、以及烟囱Opacity等。为了同时覆盖“异常”和“正常”段落,时间序列按10分钟滑动平均进行平滑处理,最终得到超过1.3万条样本记录。随后在FoREMaL Explorer中设置随机森林/Forest of Forests相关超参数,采用典型的训练/测试集划分(如80/20)进行交叉验证,模型在测试集上的预测相关系数R²约为0.86,说明在给定数据和特征组合下,Opacity的变化可以被模型较好拟合与解释。

模型训练完成后,软件首先输出对目标变量Opacity影响程度的“特征重要性排名”。研究显示,排名靠前的多为与C室西侧电场相关的TR二次电流、电压及触发角等电参数,同时四台ID风机入口导叶开度也全部进入前15名,其中4号IDF导叶控制信号的重要性排名显著高于另外三台风机。这一结果在与ESP工艺专家共同解读后,被认为反映了ESP各室负荷分配与烟气流量分配的不均衡:部分腔室“超负荷”捕集粉尘,而另一些腔室则偏闲置;与此同时,个别IDF可能抽吸了异常偏大的烟气量。

在可视化层面,FoREMaL为前若干重要特征分别生成了“Opacity散点图+灵敏度曲线+直方分布”组合图。灵敏度分析的做法是:在保持其他特征不变的情况下,将某一特征从其最小值到最大值分段取定,逐步输入已训练好的随机森林模型,计算对应的预测Opacity平均值,并与样本整体平均Opacity对比,得到该特征在不同取值下对Opacity的正负影响趋势。以C室第5电场西侧二次电流C5W-SC-(mA)为例,灵敏度曲线显示,当电流提升到约740 mA以上时,预测Opacity出现明显阶跃式下降且保持在较低水平,这与“下游场区电流偏高、说明粉尘负荷低、电场工作在更佳收尘状态”的行业经验基本吻合。类似地,4号IDF入口导叶开度在大于约57%时,对Opacity的敏感度显著增加,提示一旦该风机开度偏大,整体气流场会向对应ESP腔室偏流,造成粉尘负荷及不透明度上升。

基于上述灵敏度分析,FoREMaL Explorer进一步自动生成一份“操作建议清单(Action List)”,对前15个关键特征给出推荐阈值方向,例如某些电场的二次电流/电压应保持在某一值以上,某些触发角应控制在上限或下限以下,四台IDF导叶开度应限制在约56%–59%以内,机组负荷水平尽量维持在某一值之上等。值得注意的是,当前版本的工具并不区分“可控变量”和“被动响应变量”,即这些建议需要由ESP及锅炉运行专家再进行一次筛选和工程化解读,明确哪些参数可以通过控制系统或检修手段调整,哪些只是问题的“症状”而非“手柄”。

在本案例中,结合模型输出,电厂工程师最终通过现场检查发现:2号引风机入口导叶与驱动轴发生脱开,导致指令开度与实际开度严重不一致,进而引起ESP多室烟气量分配失衡,部分电场超负荷运行,Opacity基线抬升。需要强调的是,模型本身并不会直接告诉你“2号风机导叶联轴器脱开”,但它将焦点快速聚焦在“IDF导叶位置异常”和“C室若干电场负荷异常”这两个区域,大幅缩小了故障排查范围,节省了试错时间,减少了不必要的机组降负荷或非计划停运风险。

对行业而言,这项工作有几层值得关注的启示:第一,随机森林及其延展算法FoF在ESP这样的多室、多电场、多工况耦合系统中表现出较好的可解释性与实用性,尤其适合做“变量重要性排行+灵敏度分析+操作建议”的组合应用;第二,将机器学习模型封装进像FoREMaL Explorer这样的专用工具,有利于打通“数据科学”和“环保工艺”之间的认知鸿沟,使电除尘器故障诊断从经验驱动逐步过渡到“经验+数据”双轮驱动;第三,该工具思路同样适用于其他烟气治理单元,如SCR脱硝、湿法脱硫(FGD)、干法或半干法脱硫、空气预热器结垢与腐蚀风险预测等,只要具备足够的DCS历史数据与合理的目标变量设计。

从应用前景来看,作者团队后续计划将FoREMaL Explorer进一步发展为无需额外数据输入的“场站独立模型”,并探索将其嵌入到开放环节的运行指导系统中,形成类似“ESP智能顾问”的在线预测与预警工具。在“双碳”与超低排放常态化的背景下,这类基于机器学习的智能诊断平台,将成为传统烟气治理装备数字化、智能化升级的重要抓手,也是静电除尘器在存量改造市场中提升竞争力的关键技术方向之一。

参考文献
[1] Song, J., et al. A globally enhanced general regression neural network for on-line multiple emissions prediction of utility boiler. Knowledge-Based Systems, 2017, 118: 4–14.
[2] Nie, F., Oztekin, A. A study of the prediction of ammonium bisulfate formation temperature by artificial intelligence. ProQuest Dissertations Publishing, 2017.
[3] Wang, X., Chang, T. The balanced model and optimization of NOx emission and boiler efficiency at a coal-fired utility boiler. IEEE Conference Anthology, IEEE, 2013: 1–4.
[4] Bazzi, T., Zohdy, M. Artificial Intelligence for Air Quality Control Systems: A Holistic Approach. In: 2018 Twentieth International Middle East Power Systems Conference (MEPCON), IEEE, 2018: 25–32.
[5] Strobl, C., Boulesteix, A.-L., Zeileis, A., Hothorn, T. Bias in random forest variable importance measures: Illustrations, sources and a solution. BMC Bioinformatics, 2007, 8(1): 1–21.
[6] Estes, M. Artificial Intelligence for Precipitator Diagnostics. Presented at A&WMA Mega Symposium, Baltimore, MD, August 2016.
[7] EPRI. FoREMaL Explorer User Manual, beta-version 1.0.1. Palo Alto, CA, December 2020 (unpublished).
[8] EPRI. Application of Novel Random Forest Approach for Environmental Controls: Development Status. Palo Alto, CA, 2021. 3002021062.

获取更多静电除尘相关专业论文,请访问 https://isesp.org/conference-papers/