文献标识码:B文章编号:1003-0492(2025)10-106-05中图分类号:TP391.41
★袁志胜,马聪,潘海波,胡文耀,蒋心为(北京广利核系统工程有限公司,北京100094)
关键词:核电;图形识别;形态学;开运算;漫水填充;字义匹配;卷积迭代
1 引言
控制逻辑图(Causal Loop Diagram,CLD)是一种描述核电仪控系统控制逻辑的图纸,也是核电仪控系统设计过程的重要文件,以及下游设计的关键依据文件。核电项目中,相同堆型新电站的CLD图往往都是在参考电站基础上做相应的修改而成。
下游设计时,为了提高设计效率和设计成果利用率,首先是选择某个参考电站的设计成果作为基础版本,然后识别出新电站和参考电站CLD图之间的差异,再在参考电站设计成果基础上针对这些差异进行相应修改。如何识别这些差异成为项目设计质量的关键。CLD图数量大,细节多,人工识别容易疏漏。
由于文件传递规范及知识产权等原因,核电项目中文件格式要求PDF文件,原始设计文件很难获取。采用计算机图像识别技术可有效提高识别效率和质量。
2 算法方案
CLD图的文件格式是PDF,PDF中不同软件输出的文件格式可能不同。为了满足更多的数据格式,需要将PDF文件中的内容转换为图像,再通过图像进行识别。CLD图需要识别的内容由模块、文本、实线、虚线、取反符等元素组成。不同的元素的识别方法和顺序有所不同,但最终是识别出所有元素形成结构化数据进行储存。
在核电仪控系统的CLD图中,有几个关键元素对于系统的设计和实现至关重要:
云图:用于标记图纸上模块或连线的新增、删除或修改区域。云图通常以闭合曲线的形式出现,用于突出显示特定区域。
文字描述:位于模块内或图纸其他位置的文本信息,提供对模块或连接的具体说明,包括名称、参数和功能描述。
模块:CLD图的基本单元,表示系统中的具体功能块或设备。每个模块通常包括文本描述、输入输出端口,以及与其他模块的连接关系。
连线:连接不同模块的线条,表示模块之间的数据或信号传输。连线可以是实线或虚线,实线代表实际的连接,虚线通常表示参考或虚拟连接。
取反标识:表示信号或状态取反的符号,通常以一个圆形或其他符号表示,出现在相关模块附近。
图1算法总体流程图
图1流程图展示了从图纸初步处理到最终模块属性提取的全流程。每一步骤都对应一种特定的图像处理或分析技术,以确保在复杂的CLD图纸中正确识别和解析出各关键元素。通过这一流程,算法能够高效地提取出图纸中的结构化数据,保障了后续设计工作的准确性和一致性。
2.1 图像预处理
图像预处理是识别算法的第一步,主要包括灰度化和二值化。灰度化是将彩色图像转换为灰度图像,保留图像的亮度信息,去除颜色信息。二值化如图2所示,是将灰度图像转换为二值图像,使图像中的像素值只有0和255两种,以便于后续的形态学处理。
图2二值化
2.2 云图的识别
云图是CLD图中的一种标注信息,即为云图所圈位置存在模块新增、删除或修改,在获取序列化数据的时候应识别并去除云图信息。云图识别如图3所示。
图3云图识别
本文算法通过云图的特征做了正交消除算法。该算法具体流程为利用霍夫圆变换识别到圆形并全部去除,再通过形态开运算,即先腐蚀后膨胀的组合运算,再用顶帽运算,即原始图像与其开运算结果之间的差,突出图像中的小物体和亮的细节即云图的轮廓,再通过强化轮廓连接和漫水反填充算法识别到云图的包围盒,如图黄色区域为云图的包围盒。
2.3 文字识别
字义匹配通过识别模块中的文字信息,结合预先建立的模板库,匹配具体的模块类型和属性。本文采用OCR(Optical Character Recognition,光学字符识别)技术或解析PDF底层文字数据来提取模块中的文字信息,并通过以下步骤实现:
预处理:对图像进行二值化、去噪等处理,提高文字的可识别性。
字符分割:将文字图像分割成单个字符。
特征提取:提取字符的形状特征,如轮廓、笔画等。
字符识别:将提取的特征与预先训练的字符模型进行匹配,识别出文字。
通过OCR技术提取的文字信息,结合每个模块的文本特征和位置信息,进行字义匹配。匹配过程包括以下步骤:
模板匹配:将识别出的文字信息与模板库中的模块模板进行匹配,识别模块类型和属性。
语义分析:通过语义分析技术,理解识别模块中的文字信息。如果和模板库中的模板存在重叠识别或错误,可进一步校正识别结果。
2.4 模块识别
形态学处理的主要目的是消除模块之间的连线干扰,确保各个模块的独立性。它先通过腐蚀操作来缩小连线的宽度,甚至完全去除较细的连线,然后再通过膨胀操作恢复模块的边缘,以确保模块不被腐蚀。这一步骤至关重要,因为它能有效减少误识别,并提高后续模块识别的准确性。
形态学处理包括腐蚀和膨胀操作,用于弱化模块之间的连线。腐蚀操作会缩小图像中的前景对象,而膨胀操作会放大图像中的前景对象。通过选择合适的结构元素,并根据模块的尺寸信息动态调整结构元素的大小,可以有效地去除模块之间的连线。
为了更好地自适应调整膨胀和腐蚀操作中的结构元素,可根据已知的模块平均宽度和高度,动态调整结构元素的大小。假设图像中模块的平均尺寸为M×M,长线的长度为L,图像的行数和列数分别为rows和cols,为了自适应地设置膨胀和腐蚀操作的参数,使长线有效去除,需满足L>M,其中L<M的线条会被算法腐蚀消除。膨胀和腐蚀操作中,结构元素的大小k×k是关键。设膨胀操作的结构元素大小为kcol×1,腐蚀操作的结构元素大小为1×krow,则如式(1)所示:
为了使算法适应不同尺寸的模块和长线,需通过模块的尺寸信息自适应调整scalecol和scalerow。设模块的尺寸信息为Mavg(平均尺寸),则如式(2)所示:
漫水填充用于填充模块内部以达到增强模块的特征,方便算法后续完全剔除连线。开运算是先腐蚀后膨胀的组合运算,用于去除图像中的小噪声和孤立像素点。在图像处理中,我们通常使用四邻域(上下左右四个方向)或八邻域(包括对角线方向)来定义像素的连通性。对于像素点(x,y),其四邻域可以表示为式(3):
漫水填充算法可以用递归方程表示。设C(x,y)为像素(x,y)的颜色值,T为目标颜色,S为种子点颜色。对于四邻域,递归方程为式(4):
图4漫水填充
Canny边缘检测是一种多级边缘检测算法。利用Canny算法提取图像中的边缘信息,以精确定位模块的位置,并为后续的语义分析提供基础。本文通过以下步骤实现边缘检测:
高斯滤波:使用高斯滤波器对图像进行平滑处理,去除噪声。
计算梯度:通过计算图像的梯度强度和方向,检测边缘。
非极大值抑制:通过非极大值抑制方法,去除梯度幅值图中的非边缘点。
双阈值检测:使用高低两个阈值进行边缘检测,连接并保持强边缘,同时抑制弱边缘。
通过以上步骤,Canny边缘检测能够提取出图像中的轮廓信息,为后续的模块识别和字义匹配提供基础。
2.5 连线识别
在核电仪控系统的CLD图中,模块和连线的相似度非常高,都是由线条组成的。这使得在图像处理过程中,如何准确区分模块和连线成为一项关键任务。通过腐蚀操作缩小甚至去除这些连线,使模块之间的连接变得不明显或消失。在腐蚀去除连线的同时,通过膨胀操作恢复模块的边缘,确保模块不会因腐蚀而被破坏。
连线识别采用卷积迭代的方式实现。如图5所示,首先识别实线,通过对图像进行横向和竖向的闭运算,分别识别出横线和竖线。对于虚线,通过去除实线后进行单独的识别处理,对符合卷积像素大小的点作以下逻辑处理可达到线段信息:
连接条件:若存在p(xp,yp)∈Arr(像素点集合),使得|x-xp|≤2且|y-yp|≤2,则认为点(x,y)与p连接。
分组条件:若满足|xk+1-xk|≤5,则将这些点分组为一组。
创建直线:在不存在相应直线的情况下,创建直线L((xfirst,y),(xlast,y))。
图5连线识别
2.6 模块属性处理
模块属性处理包括识别模块的取反符号和模块描述信息,其中取反符由圆形表示,该圆可以通过图像分割,并结合霍夫圆检测方法进行识别。霍夫圆变换是一种检测图像中圆的方法。它通过将图像中的点映射到参数空间中寻找圆的参数。本文中使用的是OpenCV的CvInvoke.HoughCircles方法。
图6属性识别
如图6所示,加粗的圆形为算法识别到的取反符,该程序设定为通过定位模块的包围盒并向外扩展一定的距离进行图片分割,最终使用霍夫园变换识别圆形以达到识别模块取反符的效果。
图7云图包围盒
3 实验结果
为了验证本文提出算法的准确性,我们运用程序对图纸的模块、文本等信息作分类处理,然后通过程序统计序列化数据获取理论的识别数据,再通过颜色区分人工筛选遗漏和误识别信息。
图8识别结果
表1效果数据统计
对不同类型的CLD图纸进行测试,结果显示,本文算法在模块识别、文本识别和连线识别方面均表现出色,识别准确率在99.77%至100%之间,极大提高了核电仪控系统设计过程中的效率和质量。
4 结论
本文提出的识别算法针对核电仪控系统CLD图的差异识别提供了一种高效、可靠的解决方案。该方案通过图像预处理和形态学处理方法,有效消除了模块间的连线干扰;结合漫水填充与开运算,提高了模块识别的连贯性和准确性;使用Canny边缘检测和OCR技术,成功实现了对模块文本信息的高效识别;连线识别采用卷积迭代方式,分别识别实线和虚线,确保了连线信息的准确提取;模块属性处理通过图像分割和霍夫圆检测,准确识别取反符号及其他模块属性信息;云图识别则通过正交消除算法,有效去除了云图干扰,确保了数据的纯净性。
最后我们通过对大量CLD图的识别测试,验证了本文算法的有效性和准确性。实验结果表明,本文算法能够准确地识别接线图中的模块和连线,并能处理不同类型和复杂度的图纸。未来的工作将着眼于进一步优化算法,以应对更加复杂的图纸结构和图像质量问题,并探讨该算法在其他工程设计图纸识别中的应用潜力。通过不断完善和推广,期望该算法能够在更多实际项目中得到应用,以推动工程设计智能化水平的提升。
作者简介:
袁志胜(1979-),男,河北人,工程师,学士,现就职于北京广利核系统工程有限公司,主要从事核安全级仪控系统的设计工作。
参考文献:
[1] 陈卫华, 吕爱国, 黄伟军. CPR1000核电厂逻辑图与模拟图设计研究[J]. 自动化仪表, 2016, 37 (06) : 93 - 97.
[2] 刘文彬, 温柏坚, 高尚, 等. 基于深度学习的智能图像处理研究[J]. 自动化与仪器仪表, 2020, (08) : 60 - 63.
[3] Cardoner R, Thomas F. Efficient morphological set transformations on line drawings[J]. International Journal of Pattern Recognition and Artificial Intelligence, 1997, 11 (06) : 947 - 959.
[4] Chen Y, Wu L, Wang G, et al. An active contour model for image segmentation using morphology and nonlinear Poisson's equation[J]. Optik, 2023, 287*, 170997.
[5] 蔡兴泉, 杨哲, 蔡润博, 等. 基于漫水填充的图像骨架提取方法[J]. 系统仿真学报, 2020, 32 (08) : 1455 - 1464.
[6] 徐志祥, 孙文博, 邢立东, 等. 基于改进Canny边缘检测的堆叠货箱分割定位方法[J]. 测控技术, 2024, 43 (03) : 28 - 33.
[7] Yang C, Fang L, Fei B, et al. Multi - level contour combination features for shape recognition[J]. Computer Vision and Image Understanding, 2023, 229*, 103650.
[8] 郭仲. 基于改进的二值化算法与Tesseract - OCR引擎文本图像识别[D]. 杭州: 浙江理工大学, 2023.
[9] 张弛楷. 一种基于视觉的车道线检测方法[J]. 汽车制造业, 2024, (04) : 20 - 25.
[10] FAN C, DI S, HOU LL. A lane recognition algorithm based on line model[J]. Application Research of Computers, 2012, 29 (1) : 326 - 328+332.
[11] Cardoner, R., & Thomas, F. (1997). Efficient morphological set transformations on line drawings. *International Journal of Pattern Recognition and Artificial Intelligence, 11*(06), 947 - 959.
[12] 任建松, 来枫璟. 基于图像亮度均衡技术的霍夫圆检测研究[J]. 现代计算机, 2024, 30 (06) : 56 - 60.
[13] YU HS, ZHANG WH, YANG ZG, et al. An Image egmentation Method Based on Improved uperpixel Fusion[J]. Journal of Hunan University(Natural Science), 2018, 45 (10) : 121 - 129.
摘自《自动化博览》2025年10月刊





案例频道