4、系统容错设计:系统容错设计由网络容错设计、IO扫描引擎扫描规则容错设计和系统平台硬件设施容错设计构成。
1)网络容错设计厂区自控网络作为生产调度指挥中心和厂区现场自控系统控制站之间信息交互传输的核心环节,对网络传输可靠性、安全性有着极高的要求。北湖污水处理厂是在原北湖湖区沉积基础上建成,其地质条件复杂,地面沉降时有发生,对地埋电缆管沟中的通信光缆造成很大威胁。同时厂区外5km的尾水排江泵站通信光缆通过市政管网电缆井敷设,容易因为暴雨积水、道路施工等造成故障;因此,厂区自控网络采用冗余环形网络设计。厂区内各节点现场控制站均采用双网冗余结构。各节点网络交换机采用管理型交换机。节点之间通过双回路1000MB/s光纤连接。
(1)环网上的任何一个节点单侧故障均不会导致该节点信息传输中断。任何一个节点双侧或者任意两个节点双侧故障时,节点信息可以通过冗余网络传输,从而极大地保证了通信可靠性。
(2)环网上所有入网系统或设备根据预先分配的IP地址和逻辑地址进行管理和识别,通过交换机管理系统,配置网络所有交换机内部通信子网,通过内部通信子网来管理网络上各交换机之间的逻辑结构,包括交换机性能指数、交换机之间的网络树型拓扑结构、冗余侧链路等。通过对环网网络设备进行逻辑配置,可以准确地进行环网调控,防止因环形链路而造成的网络风暴,及时识别诸如环网断环异常、环上节点丢失、环上节点数据吞吐量异常、环上设备报警等故障导致的网络数据交互缓慢甚至网络崩溃的现象,同时快速定位故障点。
(3)接入网络的设备采用在线动态识别,防止非法设备接入导致网络地址冲突、数据碰撞甚至节点故障瘫痪网络;通过将端口、IP地址、MAC地址三者联合绑定,可以防止设备的非法接入,在不影响双环网正常运行的同时,最大限度地对现有网络设备进行正常监控与保护。
(4)中控室OS操作员站、ES工程师站网络和数据中心IO采集自控网络分开,且采用冗余网络接入数据中心端口,保证操作员站和工程师站操作指令安全可靠地下达到数据中心,并通过IO采集服务器传输到现场控制站。
2) 监控系统IO服务器及IO网络容错设计数据中心综合监控系统平台采用AVEVA 公司Wonderware®System Platform 系统平台。系统平台作为一个整体,访问所有外部数据(包括第三方数据源、软件应用程序、第三方控制器),它由应用服务器、Historian Server关系型数据库服务器和通信驱动程序组成。
(1)系统平台客户端从系统平台访问信息。它由监督客户端、Historian Client、Historian Client Web等组成。 Wonderware®System Platform系统平台采用实时数据库满足现场大容量、高实时的数据采集和查询要求,同时支持实时数据库分布式部署方式。单个实时数据库最大容量可以达到200万点(Tag),吞吐率为30×104 Tag/s。实时数据经过专用旋转压缩算法无损压缩后(压缩比98%)存储于关系型数据库,形成历史数据库(Wonderware Historian),可用于实时报警查询、历史报警查询和趋势查询。
(2)北湖污水处理厂生产综合监控系统涉及监控设备对象4 200个左右。直接监控点实时变量高达49000Tag。IO采集周期≤2s。采用两对冗余IO采集服务器设计,同时根据网络各节点现场控制站的数据量和网络状态进行IO服务器采集数据量分配及内部IO扫描引擎分配以达到负载均衡的目的。系统历史数据库同样采用冗余设计。 正常情况下,系统通过以太网控制网络主通信路径路由,经PLC控制站采集现场设备信号并传输控制信号。当网络上的站点发生故障或者站点主通信路径堵塞,系统可以有效识别并自动切换冗余通信路径乃至于切换冗余站点保证信号传输的持续性。冗余配置的服务器站点在主服务器故障宕机时,系统可以自动切换到从服务器继续完成和现场控制站的数据交互。图4给出了IO网络冗余扫描切换机理的案例示意。
图4 系统IO网络冗余扫描切换机理
3)硬件基础设施容错设计数据中心硬件设施采用超融合私有化部署方式构建数字云计算中心。一方面,通过虚拟化技术提升基础架构资源利用率;另一方面,通过统一的数据中心综合监控系统平台进一步聚焦生产过程信息和业务结合的创新,减少运行维保人力物力,数据中心通过承载系统核心业务系统,提供稳定、可靠和安全的运行保障。
(1)针对北湖污水处理厂综合监控系统复杂的异构网络特征,数据中心利用超融合网络虚拟化扩展特性,在同一业务虚拟机中桥接多个隔离网络,通过虚拟机层将其打通,实现业务数据互通且达到一定程度的安全防护。在网络信息安全方面,进行网络安全规划。其中通过部署硬件和虚拟防火墙,实现南北向、东西向的安全数据防护,并通过地址映射等策略与厂区网络打通。采用数据隔离网闸安全设备来限制内外访问策略,比如只开通生产数据信息由内向外发布,禁止由外向内的操作,实现数据安全双向管控。部署EDR杀毒响应平台,对业务系统进行终端安全防护。 超融合部署架构示意见图5。
(2)数据中心采用4台具备底层信息安全防护超融合一体机,以集群的方式将整个监控系统所需要的网络、存储、计算、安全等资源池化后结合业务系统部署使用,在架构设计中将数据采用双副本的方式存放在集群中,即当业务数据下发至超融合平台时,会自动生成一份副本数据,随机存放在其余主机中,从而实现1+N冗余策略(见图6):当集群内任一台主机故障时,为了保证业务的高可用性,首先将该故障主机上运行的业务虚拟机漂移到正常运行的主机上,从而保证业务的连续性,由于副本数据存放在其余正常主机中,故不会影响业务数据的完整性。且当故障主机修复后,只需上线该主机,会自动加入集群中进行数据同步任务,通过副本计算出丢失的业务数据。该任务在执行的过程中不会影响业务运行。最后通过集群内自带的负载调度功能,将繁忙主机上运行的业务虚拟切换回修复后的故障主机,保证每台主机的资源能够均衡利用,保障数据中心稳定运行。
图5 超融合部署架构
图6 超融合1+N故障切换原理
4)监控系统目前涉及实时监控量大约50000Tag,IO扫描周期1~2s,其中需要存储的数据量约25000Tag,包括报警、趋势等历史数据。实时数据采集后需要存储的数据经过旋转压缩后存入历史数据库(关系型数据库)。测算得出年存储量约为1~1.5TB。
(1)单台超融合一体机为双核CPU 主频14C28TB 2.4GHz,内存32GB,硬盘4TB,可扩展至16TB。4台超融合一体机内存128GB,硬盘总容量16TB,可扩展至64TB。
(2)北湖污水处理厂厂网一体化生产监控系统运行两年后,硬盘存储1.9TB左右。目前配置可以保证10年运行数据的存储要求。
|