★ 中煤宝山发电有限公司 佟振海
关键词:超超临界机组;动态负荷优化调度;状态感知;最优指令
超超临界机组动态负荷优化调度是提升电力系统灵活性与稳定性的关键所在。然而,现有采用传统方法的研究在应对复杂场景时,其精度与适应性均存在不足。
基于等微增率原则并考虑机组功率约束,求得火电机组最优负荷分配的精确解,进而构建线性规划模型以实现静态经济调度[1]。然而,该模型依赖固定参数假设,导致调度精度受限。基于模型预测的多模式供热电厂机组间负荷优化分配调度研究,采用滚动优化窗口来处理短期约束[2]。然而,该方法受滚动时域限制,难以适应长期扰动,导致调度精度较低。基于BA算法的火电机组分时段负荷协调优化调度,依靠群体智能进行参数整定[3]。然而,该方法缺乏热惯性感知能力,高频调整时容易陷入局部最优解。在多能源发电控制模式下,进行多机组负荷分配优化,可以协调经济性与排放之间的关系[4]。然而,该方法难以处理动态耦合问题,导致调整精度较低。
因此,本文提出了基于深度强化学习的超超临界机组动态负荷优化调度研究,以期实现高精度的负荷调度。
1 构建超超临界机组负荷优化调度模型
为实现超超临界机组在复杂电网环境下的高效、经济运行,本文综合考量了多目标因素,进而构建了超超临界机组负荷优化调度模型。
该模型的核心目标在于,在充分满足电厂生产实际需求的前提下,全力实现运行成本的最小化以及机组效率的最大化[5]。超超临界机组的总运行成本目标函数可以通过公式(1)进行表示:

式中,C表示超超临界机组的总运行成本, T表示调度周期时长,cfl t表示t时刻超超临界机组的燃料成本, cmin (t)表示t时刻超超临界机组的设备维护成本, l n (t)表示t时刻超超临界机组的计划负荷值, rl (t)表示t时刻超超临界机组的实际出力,λ表示负荷偏差惩罚系数, 表示超超临界机组的燃料成本效率惩罚系数,表示环境温度影响系数。
在模型构建过程中,本文充分考虑了多种约束条件。首先是超超临界机组功率平衡约束,设第台超超临界机组的有功功率为pi, 超超临界机组的中调指令为porder,则有pi = porder + Ai,其中Ai表示功率平衡误差。
其次,为确保超超临界机组可靠运行,需设定其最大启停次数约束。定义Mit表示超超临界机组在t时刻是否切换至启动状态,超超临界机组的启停次数约束表达式如公式(2)所示:

其中,Mmax表示超超临界机组i的最大启动次数, i表示超超临界机组i的启动次数调整裕量,n表示启停次数调整的额外系数,2表示启停次数调整的参数。
同时,为确保超超临界机组高效、安全、可靠运行,避免因过载或低载导致设备损坏及效率降低等问题,需设定其出力上下限约束。设超超临界机组的出力下限和上限分别为Qi min、Qi max ,其中负荷上限通常取超超临界机组额定功率,负荷下限通常取超超临界机组额定功率的30%,即式(3):

式中, 表示超超临界机组出力上限调整裕量, 表示超超临界机组出力下限调整系数, 3表示超超临界机组出力下限调整的频率。
上述目标函数与约束条件共同构成超超临界机组负荷优化调度模型。
2 实时感知超超临界机组运行状态信息
由于超超临界机组运行过程中会受到多种因素的影响,如负荷波动、设备老化等,实时感知其运行状态信息能够及时捕捉超超临界机组运行参数的变化,为准确评估超超临界机组运行状况提供依据。
本文采用无线传感网络接收数据包, 并对接收到的原始数据进行预处理。超超临界机组接收端数据采集的预处理公式如公式(4)所示:
(4)
式中,表示超超临界机组运行状态的接收端数据预处理结果,N表示无线传感网络的数据包序号, p表示监听频率,表示数据中心监听信道,表示波动调整系数,表示数据波动调整的额外系数。
采集到的超超临界机组相关数据需进行滤波处理,以消除其中的干扰信号,提取有效信息。超超临界机组滤波处理表达式可以通过公式(5)表示为:

式中,y(t)表示经滤波处理后输出的超超临界机组运行状态信号, ui (t)表示超超临界机组运行状态信号的权值系数向量,表示滤波调整系数,表示滤波调整的额外系数。
完成滤波处理的低压电网量测得到的超超临界机组运行状态信息,需与权重值进行乘法运算,进而得到模型下量测超超临界机组运行状态评估值。这一过程如公式(6)所示:
![]()
其中, y(t)表示y(t)的平均值, V表示对应的权重,表示评估调整系数。
通过上述一系列处理,可完成对超超临界机组运行状态的实时感知。
3 运用深度强化学习动态输出最优负荷调度指令
为了提升超超临界机组动态负荷优化调度的灵活性和经济性,本文运用深度强化学习动态输出最优负荷调度指令。该指令能依据实时感知的超超临界机组运行状态信息,快速且准确地调整超超临界机组出力,实现资源的优化配置。
在运用深度强化学习进行最优负荷调度指令输出时, 首先需定义超超临界机组的奖励函数, 如公式(7)所示:

式中,
表示超超临界机组负荷过剩量,
表示在奖励函数中用于综合衡量机组运行偏离理想状态的程度,
表示经验系数, 表示超超临界机组出力偏差惩罚系数,用于惩罚实际出力与额定出力的偏差,
表示超超临界机组额定出力,
表示超超临界机组实际出力。
该奖励函数综合多方面因素,旨在引导深度强化学习模型输出使机组运行更优的负荷调度指令。
策略网络采用Actor网络,其输出动作的概率分布,通过最大化超超临界机组累计奖励的期望值J(9)来更新策略参数,目标函数如公式(8)所示:
![]()
式中,表示训练结束的时刻, 表示折扣因子, R表示奖励平均调整系数,r(ut , vt表示在时刻t, 状态为ut,动作为vt时的即时奖励。
通过该目标函数,可使策略网络朝着累计奖励最大化的方向优化。
此时可通过迭代得到超超临界机组最优策略,即式(9)

式中,arg maxE表示在策略E下,求使期望值最大的策略,Rt表示在时刻t的即时奖励,max Q(ut+ , vt+表示在时刻t+1的状态ut+下,采取动作vt+时的最大Q值, 表示Q值调整系数。
将实时感知得到的机组运行状态数据输入到训练好的深度强化学习模型中,模型依据奖励函数和策略网络进行计算和决策,输出最优的负荷调度指令。该指令作用于超超临界机组,通过调整其出力,在满足负荷需求的前提下,尽可能降低运行成本、提升机组效率,同时严格遵循模型设定的各类约束条件,最终实现超超临界机组动态负荷的优化调度。
4 实验
4.1 实验对象与参数设定
选取某沿海火电厂的2×1000MW超超临界机组作为实验对象,该机组配备HG-3200/31.8-YM6锅炉等设备,形成了双轴驱动热力系统,其布局如图1所示。

图1 1000MW超超临界机组整体布局
机组设计热力参数详见表1,其中主蒸汽与再热蒸汽的额定参数设定为620℃/31 . 5MPa与618℃/6 . 8MPa,过热器与再热器出口蒸汽过热度均控制在15℃以上。实验中通过调整煤粉细度(R90=18%~22%)与一次风速(22~25m/s),模拟不同煤质条件下的燃烧特性,为动态负荷调度算法提供多工况验证数据。
表1 超超临界机组额定工况参数表

为了实现超超临界机组动态负荷的优化调度,本文设定了深度强化学习的关键参数,具体如表2所示。
表2 超超临界机组深度强化学习关键参数表

本文基于表2所列关键参数,构建了深度强化学习算法模型,随后借助仿真平台模拟了机组在多工况条件下的运行过程,并开展了相关实验。
4.2 实验结果及分析
基于上述实验设计,本文开展了超超临界机组动态负荷优化调度实验,其负荷跟踪精度结果如图2所示。

图2 超超临界机组动态负荷优化调度实验负荷跟踪精度结果
由图2可知,机组实际输出负荷与调度指令负荷之间的偏差极小,这一情况充分彰显了本文所采用方法的显著优势。
其中,深度强化学习具备较为强大的自适应与决策能力,能够依据机组实时状态实施精准控制。该算法的智能决策机制能够使机组快速且精准地调整参数,进而提升负荷跟踪精度。
为了验证研究方法的优越性,本文设计对比实验。将本文提出的基于深度强化学习的优化调度方法作为实验组,将基于等微增率并计及机组功率约束的火电机组最优负荷分配精确解设为对比方法1,基于模型预测的多模式供热电厂机组间负荷优化分配调度研究设为对比方法2,基于BA的火电机组分时段负荷协调优化调度设为对比方法3。经过实验,四种方法的调度稳定性结果如图3所示。

图3 四种方法的超超临界机组负荷调度稳定性对比
由图3可知,随着负荷调整次数的增加,本文方法的负荷标准差始终维持在0.8%以下,而对比方法1在调整次数超过15次后标准差急剧攀升至2.1%,对比方法2和3虽在初期表现稳定,但分别在20次和25次调整后出现标准差跃升至1.5%和1.3%的拐点。
稳定性差异源于本文方法对系统动态特性的深度学习能力。该方法通过感知24维状态变量构建非线性映射,使方差贡献率降低42%。相比之下,对比方法依赖固定模型,易陷入“累积误差陷阱”。本文方法的奖励函数设计实现了稳定性与经济性的平衡,充分验证了其优越性。
5 结束语
本文针对超超临界机组动态负荷调度问题,提出了基于深度强化学习的优化方法。该方法通过构建多目标模型,并结合无线传感网络实时感知机组状态,动态输出最优调度指令。实验结果表明,该方法负荷标准差维持在0.8%以下,较对比方法最高降低63%,为超超临界机组的动态负荷优化调度提供了新思路。
作者简介:
佟振海(1989-),男,江苏南京人,工程师,学士,现就职于中煤宝山发电有限公司,研究方向为火电项目建设与运行管理。
参考文献:
[1] 丁涛, 黄雨涵, 张洪基, 等. 基于等微增率并计及机组功率约束的火电机组最优负荷分配精确解[J]. 中国电机工程学报, 2024, 44 (04) : 1446 - 1460.
[2] 郭赉佳, 李博, 陈立东, 等. 基于模型预测的多模式供热电厂机组间负荷优化分配调度研究[J]. 热能动力工程, 2022, 37 (08) : 18 - 24.
[3] 钱飞强. 基于BA的火电机组分时段负荷协调优化调度[J]. 中国新技术新产品, 2025, (01) : 23 - 25.
[4] 吴燕玲, 任庆, 徐家豪, 等. 多能源发电控制模式下多机组负荷分配优化[J]. 热能动力工程, 2023, 38 (08) : 68 - 75.
[5] 李斌, 刘文胜, 王介生, 等. 基于动态惩罚因子的改进蚱蜢算法求解经济负荷调度和经济排放联合调度问题[J]. 控制与决策, 2022, 37 (07) : 1819 - 1826.
摘自《自动化博览》2026年5月刊






案例频道