计算机论文:电站监控系统PCX故障及解决措施
惠州抽水蓄能电站位于广东省惠州市博罗县城郊,8 台立式单级混流可逆式水泵水轮发电机组分别安装在 A、B 两厂内,每厂内 4 台,单机容量( 发电工况) 为 300 MW,总装机容量为 2 400 MW,3 回 500 kV出线与电力系统相连,主要承担电网的调峰填谷、调频任务。
电站计算机监控系统作为电站生产运行的实时操作、监控、管理系统,按照国际先进水平设计,充分满足地下厂房有相关洞室群的无人值班运行管理,充分发挥地面中控室和南方电网总调度中心的远方、直接监控、调度作用。电站监控系统进行 A、B 厂统一规划、设计和建设,既满足 A 厂、B 厂分步建设和分期投运的要求,又实现全站生产运行统一、集中监控、管理,并充分考虑系统的安全可靠性和技术先进性[1 -2].
电站监控系统的实施经过国际招标,确定了 Als-tom 为集成商和供货商,其 ALSPA P320 监控系统面向大中型水电站、抽水蓄能电站开发,为分层分布式计算机监控系统,由 CENTRALOG( 上位机设备及功能) 、CONTROLBLOC( 现地控制单元设备和功能) 、S8000E( 电站监控网络) 、F8000( 现场总线网络) 等构成。监控系统的设计和实施,充分体现了开放性、可靠性和行业先进性。
电站计算机监控系统( 简称 CSCS) 采用全分层分布式计算机监控系统,对电站的生产控制分为远方调度层控制、电站中控层控制、现地控制单元层( LCU层) 控制和设备就地控制,其中就地控制权限最高,其次为 LCU 层控制权,其后为中控层控,调度层的控制权限最低[3 -4].该控制系统包含上位机、下位机两部分,负责蓄能机组及公用系统的数据采集、故障判断,机组控制程序执行、AGC/AVC 功能、调度通信服务等功能。该套系统于 2008 年投入使用。
1 机组核心控制器运行方式
其下位机核心控制器为 PCX,如图 1 所示。核心控制器采用嵌入式系统冗余设计,运行 Windows NT 嵌入式系统,采用工业控制领域流行的 ISaGRAF 分布式控制平台。其主要功能为实现与控制室的控制数据通讯,冗余管理,顺序控制,主程序控制,数据采集,控制流程程序执行,信息通信,历史数据存储。一般的、重要的、绝大部分的控制程序都放在 PCX 中,如开关机流程、各种工况相互间转化流程等,实现数据的采集、处理,将采样信号和经过时间标记的事件送到控制室等。PCX 控制器为冗余配置,当一个正在运行的 PCX发生故障后,待机的 PCX 将马上代替。从物理位置来分,左边的 PCX 控制器称为 Primary,右边的称为 Sec-ondary; 而从主备用的情况来分,主用的 PCX 控制器称为 Master,备用的称为 Standby.
PCX CPU 卡件采用 ADlink 生产的 cPCI - 3840 嵌入式工业系统,配置 Pentium M1. 4G 的处理器,2 个100 M 网口,1 个 USB 口。PCX 作为整个机组的核心控制器,所有机组的实时数据都经过 PCX 处理,且PCX 采用热备用运作模式,即主备用 PCX 同时运行,通过冗余网线交换数据,当主用 PCX 出现故障时,无缝切换至备用 PCX 运行。
2 PCX 故障及解决措施
2. 1 故障状况
1) 2011 年 10 月 31 日,监控系统报警 5 号机组PCX 故障,该 PCX 与上位机网络断开。现场检查网络通讯正常,但无法通过 PCX 登陆管理界面进行重启,只能手动断电重启,重启后 PCX 指示灯报故障且无法正常运行。更换新的 CPU 和 CF 卡,对 CF 卡进行初始化并载入 5 号机组 PCX 程序,更换后恢复正常。后期在中控室模拟盘 LCU 上试验,发现 5 号机组故障的PCX 的 CPU 和 CF 卡均已损坏。
2) 2013 年 8 月 1 日发现因 5 号机组主用 PCX 故障导致 S8000 -1 网络闪断报警,在工程师站无法登录5 号机组主用 PCX 管理界面; 从备用 PCX 进入备用PCX 管理界面,发现存在一连串与主用 PCX 对时相关故障。而现场运行主用 PCX 指示灯指示闪烁正常,无法通过管理界面软重启,通过断开工作电源将主用PCX 重启,重启后故障消失,PCX 工作正常,说明当时主用 PCX 处于死机状态,无法对人员操作进行响应。
2. 2 故障原因
通过对 PCX 故障进行了专题分析,对故障现象、PCX CPU 结构、PCX 的运行机理、运行环境做了分析,得出了以下原因。
1) 机组核心控制器 PCX 采用冗余配置,采用热备用的工作方式,当主用 PCX 出现故障时,备用 PCX 可以立刻切换,达到无缝切换效果,但热备用方式决定了PCX 设备必须长期处于运行状态,对 PCX 设备本身可靠性要求较高。从发生的历次故障中,发现 PCX 控制器硬件组合十分紧密,两套系统 10 余块卡件共同安装于 1 个框架中,通风散热效果差,而且 PCX CPU 卡件由于本身设计缺陷,缺少散热原件,只依靠 CPU 芯片通过空气自然散热,散热效果不佳,影响了 PCX CPU的工作性能及状态。
2 ) 机组核心控制器PCX是ALSTOMP320 系统连接上位机及下位机的关键设备,现场采集的机组监控数据通过 PCX 处理后再上送至上位机数据服务器,而且机组核心控制器 PCX 还担负着机组程序的运算载体,由 PCX 完成机组运行的大部分程序运算及数据处理,工作情况下,PCX CPU 处理数据及程序量较大,运行负荷重,对芯片的散热能力也是极大的考验,系统剩余运算容量较小,对维护人员后期改造维护也带来不便。
2. 3 解决措施
针对以上问题,在设备运行风险评估、安全性评价以及稳定分析等工作的基础上,对设备存在的安全隐患和问题,有针对性地提出对 PCX 卡件的软硬件进行以下升级的要求[5 -6].
1) 针对核心控制器 PCX 的安装环境,对目前的PCX 各工作卡件位置布置情况进行优化,使其在框架内形成有效风道,方便散热,并且改善 PCX 安装盘柜内部通风设备,提高柜内通风散热能力。
2) 现地控制器 PCX CPU 硬件换型,提高 PCXCPU 的本体散热性能,对元件的分布进行调整,并重新设计散热部件,采用散热性能较好的散热片,提升CPU 卡件自身散热性能与效率。
3) 升级 CPU 卡件的固件,完善机器功能、修补机器漏洞,提高 CPU 运行稳定性。优化程序提高 CPU运算能力,在保证程序运行稳定的基础上降低 CPU 的运算负荷。
4) 设计新的固件导入工具及导入流程,提高 PCX固件的更新速率。
5) 对全厂 8 台机组控制系统、4 台公用控制系统、开关站控制系统、模拟屏控制系统、上下库控制系统以及黑启动控制系统共 17 台控制系统进行了更换 PCXCPU 的工作; 进行了初始化,固件升级。PCX 升级后降低了故障率,提高了控制系统的可靠性,有效地保障机组运行可靠性及稳定性,提高了机组的调峰调频应急启动能力,减轻了运行值班员及 ON - CALL 人员工作量。
通过对故障设备进行专题分析、深入研究后提出了切实可行的改造建议,更新为更稳定、功能更完善的新机器,切实提高设备的可靠性; 对 PCX 学习并对其硬件软件结构进行分析并依靠自身知识提出改造方案,涉及的计算机控制系统包括硬件、软件和控制算法等,提高了参与人员微型计算机的知识水平并具有综合运用所学知识分析问题和解决问题的能力,锻炼了参与人员的协调组织和应急能力。
参考文献:
[1]朱黎明,吴龟灵,李新碗,等。 OBS 核心控制器结构设计与硬件化实现[J]. 电子技术,2009,46( 3) : 33 -35
[2]王国军,陈松乔。 自动控制理论发展综述[J]. 微型机与应用,2000,19( 6) : 4 -7
[3]周全仁,张海。 现代电网自动控制系统及其应用[M]. 北京: 中国电力出版社,2004
[4]王平,刘复玉。 PLC 自动控制系统可靠性研究[J]. 电气传动,2001,31( 1) : 36 -38
[5]李伟。 白水峪水电厂计算机监控系统及相关设备升级改造[J]. 水电与新能源,2014( 12) : 34 -37
[6]甘魁元,雷雄波,李明武。 监控系统光字报警信号优化设计[J]. 水电与新能源,2014( 7) :30-32
编辑推荐:
温馨提示:因考试政策、内容不断变化与调整,长理培训网站提供的以上信息仅供参考,如有异议,请考生以权威部门公布的内容为准! (责任编辑:长理培训)
点击加载更多评论>>