★ 黄建伟(浙江浙能兰溪发电有限责任公司,浙江 金华 321000)
摘要:随着云计算技术在各行各业的广泛应用,发电企业也呈现出其独有的私有云场景特征,发电企业的生产管理系统(MIS)、厂级监控系统(SIS)、办公自动化系统等非生产大区内业务已不同程度地迁移至私有云。本文从私有云应用角度出发,结合工控系统数据业务域离散、数据量巨大、实时性要求高的特点,分析生产区工控系统工控机特征,研究并构建基于超融合技术的工控系统私有云平台。
关键词:超融合;容错;私有云;H-DCS;HMI;智能化
1 概述
在互联网+的迅猛浪潮下,新一代的信息技术,特别是大数据、工业互联网、云计算、人工智能的快速发展,促使企业向数字智能化方向转变。发电企业目前面临的形势和挑战迫使发电企业转型升级,高质量发展需求不断增加,提升系统效率,高品质发电将成为今后发电企业发展的重要目标。
发电厂控制系统是一个庞大复杂的系统,是发电企业的核心系统,本文从控制系统的“窗口”——人机交互系统展开分析,提出H-DCS(HMI集散控制系统)设计理念,将工控机迁移至工控系统私有云集中智能化管理,提高发电厂控制系统工控机的稳定性,将上位机监控系统维护工作简单化,减少故障处理所需时间。
2 工控系统应用需求
传统上位机系统,由于24小时持续不间断工作,寿命一般在5~7年。如何优化上位机监控系统、降低维护成本、提高维护效率和控制系统稳定性成为发电企业急需解决的问题。目前上位机监控系统存在以下问题:
(1)兼容性问题
近年来计算机技术发展十分迅速,计算机硬件不断地更新换代,如CPU、主板的接口及硬盘接口容量等,与此同时操作系统的升级也从未停止。由于工控系统的特殊性,工控软件的更新速度远远跟不上计算机硬件及操作系统的迭代速度。如此就会出现上位机软件及编程软件无法兼容新硬件或新版本操作系统的情况,导致工控机只能选用老版本型号的计算机,工控机性能受限,备品备件可选择性低。
(2)硬件故障问题
工控机出现硬盘、主板等单点硬件损坏情况无法继续使用,需要重新更换配件或整套工控机。此时上位机工程及控制逻辑工程均需要重新恢复,所有软件重新安装,软件配置及通讯配置重新调试,需要耗费维护人员大量的时间。若一些工控机硬件停产,则出现无可用备件更换的问题。
(3)扩展难
新增一台操作员站或者工程师站,需要安装包括操作系统和应用软件在内的所有软件、恢复控制系统工程文件、配置通讯参数、调试画面及控制逻辑功能。技术要求非常高,并且实施工作量大。
(4)冗余成本高
工程师站或操作员站常见的是单机独立模式运行,若均配置成双机冗余模式(例如容错服务器),会造成理论可靠性高、实际使用性低的现象。另外,冗余实现方式复杂,双份硬件和软件成本更高。
3 基于超融合技术的工控系统私有云方案
基于超融合架构,计算存储统一采用标准X86硬件,运用开源虚拟化和云计算技术,构建安全可控、开箱即用、绿色节能的工控系统私有云产品。用户可根据控制系统内的服务器数量、工程师站及操作员站数量选择不同配置的工控系统私有云。产品支持根据功能需要灵活搭配,同时满足发电厂控制系统高可靠性和实时性要求。产品支持集中管理,通过统一接口进行实时管理,监控上位机监控设备运行状态。
3.1 超融合架构
超融合架构是指在一套独立服务器设备中支持计算、网络、存储和服务器虚拟化等资源和技术,多套独立服务器设备可以通过网络聚合起来,实现无缝横向扩展,构建统一的资源池。超融合架构以服务器虚拟化为底层架构,延伸出网络虚拟化和存储虚拟化,通过模块化的配置过程构建出业务与数据逻辑,实现虚拟资源的动态调度和灵活扩展。
3.2 超融合架构的特征
3.2.1 存储虚拟化
存储虚拟化后,把存储应用程序与物理的数据存储基础设施分离,基于超融合架构技术构建的私有云平台能够提高资源的利用率,简化系统的管理,对服务器硬件设备进行整合和优化,使硬件系统变成可以动态管理的“资源池”。该技术的使用,不但能够确保控制系统业务的连续性,满足可持续发展的需求,还显著提高了整个控制系统的可用性及安全性等级。
3.2.2 面向虚拟化的统一管理
超融合架构支持统一的界面管理,简化配置管理过程,提高运维的灵活性、安全性、可用性;减轻运维人员的工作负担,降低运维成本,提升SLA。超融合架构具有弹性部署优势,用户可以根据控制系统需要、预算等逐步进行系统的建设和扩展,从而降低总体拥有成本。借助超融合架构,运维将在资源丰裕性、系统可靠性、响应及时性上大大提高,以此提升服务品质和质量。
3.3 工控系统私有云平台特点
传统云计算架构复杂,平台的整体性能受限于物理设备,服务器、网络和存储设备等组件管理无法统一。同时相互独立的运维工具让维护更复杂,使得传统云计算难以应用于工控系统。基于超融合构建的工业级云架构,仅需通用的X86服务器和交换机硬件,利用软件定义技术实现计算、存储、网络的资源池化,即可替代繁重复杂的传统云基础架构,实现云架构的极简。由于传统云计算架构缺乏完整的安全体系和可靠性保障,工控系统等关键应用上云比较困难,借助超融合技术的优势,针对工控系统对私有云的可靠性、实时性和网络安全的高要求作专门的研究和优化提升,让发电企业控制系统关键应用能够部署到私有云平台上,让IT更好地驱动发电企业生产管理和运行维护变革,以实现降低维护成本、提高维护效率的目标。
工控系统私有云平台在实现传统工控机功能的基础上,还具有高容错性、高兼容性、高稳定性、高扩展性的新特性,并且硬件维护简单、可替代性高,平台智能稳定、接口丰富。
4 工控系统私有云平台的核心诉求研究
在常见的云服务模型中,包含了IaaS、PaaS、SaaS三种服务模型,其中IaaS模型的服务对象是IT管理员,PaaS模型的服务对象是软件开发者,SaaS模型的服务对象是终端用户。传统企业私有云的主要服务对象是IT管理员以及软件开发者,IT管理员更关注如何简化资源交付,基础架构管理与监控以及自动化运维等;而软件开发者更关注开发效率,持续、快速应用交付等。工控系统业务单一且功能明确,因此工控系统私有云适合建设成SaaS服务模型,同时定制化开发、自动化运维、资源监控与管理功能集成在云管理平台。
4.1 业务更“敏捷”的研究
在传统的架构下,用户基于业务系统的资源需求,独立采购软件和硬件设备,一般需要经历预算—测试—招标—采购—部署—上位机监测系统上线等流程,整个过程复杂、耗时,很难实现工控机快速部署。发电企业用户对私有云的一个核心诉求是:资源可方便地进行交付,引入更多自动化功能帮助企业缩短业务系统的部署与投用流程,使发电企业在竞争中获得更大的优势。
4.2 业务更“稳定”的研究
一般工控上位机监控系统被要求提供7×24h的不间断服务,事实上,上位机监控系统一直面临着各种风险和挑战,包括停电、网络故障、硬件故障等问题,这些问题都有可能影响上位机监控系统的可用性。特别在传统架构下,随着工控机数量的增多,上位机监控系统引入了更多不同的设备以及技术,增大了维护的复杂性,使得企业的维护人员经常上演“消防员”角色。因此发电企业构建私有云另外一个重要诉求是:私有云应该具备更简单的维护、更高的容错性,甚至是一定程度的故障自愈功能。
4.3 资源交付更具“弹性”的研究
在传统工控机架构中,工控机往往是基于某个业务系统投用而建立,与业务系统有比较强的耦合关系,工控机资源之间无法流动,容易造成资源孤岛以及资源利用率较低等问题。另外工控机资源建设缺乏通盘的考虑,导致管理与扩展成本比较高。发电企业用户对私有云的另外一个期许是:将零散工控机资源进行统一管理,建设统一资源池,实现更灵活的资源划分与交付;资源应具备“弹性伸缩”特性,可对资源进行生命周期管理,既可迅速扩展资源规模,也可以及时回收“闲置”资源进行重分配。
4.4 技术路线
4.4.1 虚实结合功能互备的高可用性冗余设计路线
立足于火电厂辅控网络现状及需求,提出工控机虚实结合功能互备的高可用性冗余设计理念。优化上位机监控系统,平衡上位机监控软件、操作系统、主机硬件之间的兼容需求,解决硬件的低容错性故障引起的上位机监控系统停运等维护问题。将就地离散的工控机物理资源虚拟化集中智能管理,既提高了工控机物理硬件的高可靠性,又提升了工控机系统的可控性和兼容性。
同时,保留原集控室内工控机并安装配套开发的HMI同步插件,与虚拟化后进入辅控网络私有云平台的工控机功能互备,构成虚实结合、功能互备的多重高可用性冗余上位机。
4.4.2 高弹性架构的HMI实时数据库
基于KVM开源技术开发并优化,解决工控系统私有云机柜的高可靠性问题,研究网络配置的可靠性、网络通信的可靠性,以及控制系统软件和数据库的高可用性应用等,实现对物理主机资源、网络资源的高可用性提升。
开发高弹性架构的HMI实时数据库,该架构优化了HMI软件与PLC控制器的通讯方式。支持N套HMI软件同时连接高弹性HMI实时数据库,经高弹性HMI实时数据库优化访问请求后统一连接至PLC控制器。可有效阻断HMI侧出现爆发式流量请求或者其它恶意攻击情况时,对PLC控制器造成灾难性冲击。
4.4.3 数字化、智能化的建设提供技术基础
为控制系统数字化、智能化的建设提供技术基础,实现数据的采集、存储、显示的集中托管,并提供各类数据接口。简化系统结构,加强对工业环境的适应能力,减少维护工作量,降低整体维护成本,提高工控机数字化、智能化能力。实现智能化管理工控系统私有云机柜,实时监测服务器健康和能耗状况,智能分析与风险预测,实现工控系统私有云机柜部署的“自动化”和维护的“傻瓜化”,做到一站式交付、家电化安装、一键式业务部署。
4.4.4 智能管控平台
基于分散控制系统基本设计思想开发,兼顾分而自治和综合协调的设计原则,广泛应用高可靠性的工业级硬件设备和生产工艺,采用冗余技术,在软件设计上实现系统的容错技术、故障自诊断和自动处理技术等。平台管理界面依据HMI监控界面风格及运行维护人员使用习惯开发,并且能够嵌入至HMI系统实时监控。
5 现场实施
5.1 现场概况
目前#1/2机控制室布置有4台操作员站(兼工程师站)、#3/4机控制室布置有2台操作员站(兼工程师站)、脱硫除灰控制室布置有5台操作员站(兼工程师站)、化水控制室布置有2台操作员站(兼工程师站)、除灰控制室布置有2台操作员站(兼工程师站)、输煤系统布置有2台操作员站(兼工程师站)。
根据辅网子系统的功能按“ 水” 、“ 煤” 、“灰”3个系统设立相应的3个分区集中控制点监控。
改造后“水”系统布置4台操作员站,“煤”系统部署2台操作员站,“灰”系统部署5台操作员站,部分操作员站兼工程师站,如图1所示。
图1 改造后辅网子系统分区集中控制点分布
5.2 部署工控系统私有云机柜
(1)安装机柜
工控系统私有云机柜安装方式和DCS系统盘柜安装方式一致,机柜底座固定安装在槽钢上,安装过程做好绝缘及接地保护等工作。
(2)电源接入
工控系统私有云机柜内含有一套冗余电源模块,该电源模块布置在机柜上层,进线电源为双路220VAC电源,其中一路进线电源设计为保安段电源。
(3)布置网络
工控系统私有云机柜内集成有两台支持虚拟化的核心交换机,瘦客户端连接至两台核心交换机可实现与工控系统私有云机柜的数据交互。工控系统私有云机柜通过核心交换机连接至工控系统网络可实时采集现场PLC数据,实现上位机监控功能。瘦客户端的通讯网络与工控系统网络相互独立,不交叉混用。故需要铺设瘦客户端至工控系统私有云机柜之间的网线或者光缆。
(4)安装瘦客户端
根据现场情况,安装瘦客户端并提供电源220VAC及网络。
5.3 操作员站及工程师站功能迁移至工控系统私有云
迁移物理工控机上的工控软件和数据到工控系统私有云中,将使用到P2V工具。这种迁移方式,主要是把物理工控机上的工程状态和数据“镜像”到工控系统私有云中,并且在工控系统私有云的虚拟机中恢复物理工控机上运行的工程。
5.4 工控系统私有云试运行
调试完成后工控系统私有云虚拟机系统做好镜像和快照,原上位机系统安装HMI同步插件并同步运行。
6 结语
通过对当前业界主流技术的调研分析,以及前述超融合技术与私有云技术的结合可以看出,利用该技术可以为发电企业带来以下优势:
(1)整个工控系统私有云平台采用集中管理的模式,所有的工控机系统都在统一的平台上运行,对应的维护及管理人员可以整合,节省了人力成本;
(2)应用集中管理模式,维护及管理部门可以直观地查看所有的工控机数据应用的运行情况,维护及管理工作变得简单高效;
(3)各个工控机应用集中于同一个工控系统私有云平台上,避免了数据的孤立和难以利用的问题,人机交互界面和应用之间的数据流转也十分简便快捷,更有利于挖掘发电企业生产数据的价值。
发电企业的生产数据具有深度挖掘的价值,灵活高效地管理这些数据资产,使之更好地为发电企业安全稳定运行服务,促进企业数据保值增值。基于H-DCS(HMI集散控制系统)理念的工控系统私有云为实现高效率、高品质发电提供了一个很好的思路,不仅具备传统的工控机功能,还具有独特的优势,如维护方便、系统资源实时监控、冗余容错率高等。AP
作者简介:
黄建伟(1982-),男,浙江金华人,工程师,现就职于浙江浙能兰溪发电有限责任公司,主要从事火电厂热控技术管理工作。
参考文献:
[1] 季向远, 杨涛, 李巧红, 等. 构建安全的私有云存储平台[J]. 机械设计与制造工程, 2014, (10) : 51 - 53.
[2] 解辰辉, 寇鹏, 刘承亮. 科研机构私有云建设模式研究[J]. 铁路计算机应用, 2017, (11) : 45 - 48.
[3] 汤晓鹏. 浅谈企业私有云平台建设[J]. 新疆电力技术, 2016, (2) : 75 - 77.
[4] 马小龙, 刘兰娟. 基于在线机制设计的私有云资源分配研究[J]. 计算机应用研究, 2015, (02) : 539 - 542.
[5] 吴劲松, 王磊, 伍治平. 一种标准化的私有云服务建模方法[J]. 计算机应用研究, 2015, (04) : 19 - 24.
摘自《自动化博览》2021年12月刊