ABB
关注中国自动化产业发展的先行者!
CAIAC 2025
2025工业安全大会
OICT公益讲堂
当前位置:首页 >> 案例 >> 案例首页

案例频道

基于视频分析的视觉检测算法研究
  • 企业:     领域:机器视觉     行业:烟草    
  • 点击数:1212     发布时间:2024-05-15 19:37:50
  • 分享到:
本文针对运动烟支的动态监测、视频合成、缺陷分析等关键问题展开研究,并取得了一定理论和实用价值的成果。本文的工作包括:(1)视频合成的研究:一般工业相机采集的数据为单张的图像数据,并不能直接进行视频的保存。本研究采用FFmpeg开源视频处理库对采集到的图像进行视频合成,并利用视频的帧内压缩以及帧间压缩技术,成功实现海量图像的视频化动态存储。(2)基于卷积神经网络进行的深度学习研究:利用主流深度学习框架Pytorch对卷积神经网络的数据输入层、卷积计算层、激励层、池化层、全连接层等层进行研究并修改,在测试数据集上的实验结果表明了卷积神经网络在缺陷检测方面的优势。

文献标识码:B文章编号:1003-0492(2024)04-074-04中图分类号:TP29

★王俊鹏,蔡革英,韩梅(红安卷烟厂,湖北黄冈438400)

关键词:视频分析;视觉检测;烟支检测

1 基于视频分析的烟支视觉检测算法概述

目前,针对烟支的视觉检测主要有两种方法:第一种是通过对焦距离来实现的;第二种则是利用光学系统中的焦距和光圈等参数来进行识别。在实际应用过程中,由于拍摄角度以及成像质量等因素的影响,会导致所得到的图像存在一定程度上的失真现象。一般工业相机采集的数据为单张的图像数据,并不能直接进行视频的保存。而且因为烟支本身具有特殊性,所以需要采用一些其他技术手段来保证数据信息的准确性。例如,可以使用机器学习或者深度学习等方式来完成对烟支的检测工作。然而,这些方法都无法满足烟支检测系统对实时性要求较高的需求。为此,国内外学者开始将目光转向了计算机技术领域,希望借助计算机技术来解决这一难题。其中,最为常见的一种手段即为视频分析法。该方法主要通过摄像头获取烟支图像,然后根据烟支图像特征选择合适的阈值对其进行分割,最后再结合相应的数学模型计算出烟支的具体位置[1]。KIM等人针对烟支图像中的像素点分布不均匀以及烟支图像边缘模糊等问题,提出了一种基于灰度共生矩阵(GrayscaleCommunity Matrix)的烟支图像分割模型[2-3]。首先,他们从原始烟支图像中随机选取一定数量的像素点作为初始化的训练样本集;接着,在此基础上,分别使用3个不同尺度的卷积核对每一个样本进行卷积操作,并且利用最大类间方差、平均值和标准偏差三个指标来衡量这三组参数之间的差异程度,以此来确定最佳的卷积层数;随后,采用多尺度融合技术对不同尺度的烟支图像进行处理,最终得到具有较高分辨率的烟支图像。该方法不仅能够有效地提高烟支图像分割精度,而且还可以降低计算成本。还有研究人员将残烟支链与其他图像处理技术相结合,以便更好地提取残烟支链的边缘轮廓特征。

目前,国内外学者已经将深度学习应用于烟支图像分割领域,并取得了不错的效果。文献所用的方法主要包括有监督的自适应加权网络结构、无监督的半监督结构、混合式的卷积神经网络结构、基于注意力机制的卷积神经网络结构等。

基于视频分析的视觉检测算法通常由特征提取模块(Feature Extraction)、特征融合模块(Convolutional Encoding)以及特征通道处理模块组成。其中,特征提取模块负责对输入的原始数据进行预处理,并且利用卷积神经网络来获取特征通道,然后再使用特征融合模块对特征通道进行特征提取,最后将特征通道输出到分类器当中。特征融合模块则通过计算每个像素点与其他所有像素点之间的距离来实现,其目的就是为了提高模型的泛化能力。而特征通道处理模块则是根据不同颜色区域的灰度值来判断该区域是否属于同一类别,如果不是就会直接丢弃该类别的数据。目前,基于视频分析的烟支视觉检测算法已经被广泛应用于烟草行业的生产过程中。

2 运动目标二值化分割

2.1 常用的运动目标检测方法

目前,针对运动目标检测的主流技术包括图像处理(如去雾)、特征提取以及目标定位等。其中,对于运动目标检测而言,最为常见的就是采用深度学习模型来实现。对运动目标进行二值化处理,可以有效地提高检测精度[4]。此外,还有一些其他的运动目标检测方法也被应用到了运动目标检测当中,例如基于卷积神经网络的运动目标检测、基于多尺度融合的运动目标检测、基于注意力机制的运动目标检测等等。但是这些方法均存在一定的不足之处,主要表现为以下几点:(1)需要大量的数据作为训练样本,这就导致其计算成本过高;(2)无法保证运动目标的准确度;(3)难以实现大规模的推广应用。

2.2 基于HSV空间的运动目标检测

由于运动目标的复杂性和多样性,需要对其进行分类识别。因此,首先将采集到的运动目标数据转换成HOG颜色空间下的RGB三通道分量图;然后根据每一个像素点对应的RGB三个通道分量图计算出该点所在位置的三维空间坐标(x,y);最后通过坐标变换得到该点在整个图像中所占的比例。

利用上述方法可以实现运动目标的二值化分割,但是这种方法只能针对单一的前景目标进行分割,而无法满足多个前景目标的情况。因此本文提出了一种基于HSV空间的运动目标二值化分割方法。具体步骤如下:

(1)提取运动目标的特征信息。采用HSV空间模型对运动目标进行二值化分割,以便于后续的前景检测与定位。

(2)建立HSV空间模型。首先根据运动目标的位置信息确定待测对象的大致范围,然后使用HSV空间模型计算出该点到所有像素的距离,再用该距离除以该点到物体中心的距离即可得出该点的三维空间坐标。

3 运动目标特征提取与计数—以运动烟支为例

3.1 基于帧差法的运动烟支视频分析法

在对运动烟支进行识别之前需要先对其进行预处理。通常情况下,可以采用二值化处理或者去噪处理等方式去除噪声、增强细节信息;然后再根据不同的运动目标采取相应的检测手段。一般来说,如果两个像素点的灰度值相差较大且差值越大则表示该像素点所对应的运动目标就越明显,反之则越不明显。因此本文将利用帧差法来对运动烟支进行检测。帧差法是一种常用于图像分割和定位的技术手段,它能够有效地提取出图像中的每一个像素点并且使得这些像素点具有一定的相似性。具体来讲就是利用阈值来判断是否存在运动目标,若存在则认为该像素点属于运动目标,否则就不是。

在实际的检测过程中,首先要确定运动目标的位置,然后再对其进行检测。由于运动目标的形状比较复杂,所以很难直接用肉眼观察到,而是需要借助一些工具才能实现。目前,最常见的方法包括:(1)Sobel算子。这个算子是一种经典的量测算法,适用范围广,但是精度不高。因此,通常会采用其他方式来代替。例如,可以使用霍夫变换等方法来消除噪声点、减少计算量以及降低运算难度。(2)K-means聚类分析。这是一种简单实用的聚类方法,主要原理是根据给定的坐标值计算两个对象之间的差异程度,从而得到两对象之间的距离。该方法具有一定的局限性,只能识别出特定范围内的运动目标,并且无法区分同一区域内的多个对象。(3)Fisher判别器。它能够将一个二维矩阵分解成若干个互不相交的子集,每个子集中都有一个对应于某个类别的中心点,这些中心点就是被选中的运动目标。

本文利用Fisher判别器来实现运动目标的分类。首先需要确定运动目标的位置信息,然后再用其作为输入数据,经过处理后输出相应的RGB三通道彩色图像。由于运动目标的亮度值会随着时间不断发生变化,所以要先对采集到的原始数据进行预处理,包括去色、平滑化等操作;最后通过计算得到各个颜色分量之间的相关系数来判断运动目标是否存在。

3.2 基于背景减除法的前景提取

由于运动目标的复杂性,对其进行分割时会产生大量噪声点,因此需要对其进行去噪处理。目前,针对运动目标的去噪主要采用背景减去法(BackgroundDenoising),即通过计算背景像素点之间的距离来去除噪声点。这种方法简单易行且效果较好,但是会导致运算量较大;而基于深度神经网络的检测方法则是利用卷积层和激活函数将原始输入数据映射到更高层次上来提高检测精度。本文选用了一种基于深度神经网络的检测方法,该方法首先使用一个滤波器滤掉图像中的大部分灰度信息,然后再使用另外一个滤波器对这些噪声点进行进一步的过滤,最后根据阈值判断是否存在运动目标。

3.3 实验结果与分析

我们分别采用了两种不同光照条件下的动视频作为本文所提出的运动目标检测算法,即在黑暗环境下采用普通摄像头拍摄的动视频;在白天光线充足时采用SONY A7S2摄像机拍摄的动视频。首先,通过对比两组数据集上的平均精度来验证本文算法的可行性。其次,将本文算法与其他几种常用的运动目标检测算法进行比较,并且从实验结果来看,本文算法相较于其他几种算法具有更好的性能表现。

首先,通过对比不同类型的运动视频和正常视频可以发现,当视频帧数较少时(如2帧或5帧),卷积神经网络能够更好地学习到运动目标的细节特征。其次,由于运动目标的遮挡、背景噪声等因素影响,导致运动目标的识别效果较差,而卷积神经网络则具有良好的鲁棒性,即使存在轻微的噪声也不会造成严重的干扰。最后,卷积神经网络还可有效降低模型的计算成本,并且随着训练次数的增加,模型的泛化性能会不断增强。因此,相比于传统的运动目标检测方法而言,卷积神经网络不仅能够显著提高运动目标检测的准确率,同时还能够减少模型的训练时间,进而达到缩短检测时间的目的。

4 小结

本文首先针对运动烟支的动态监测、视频合成、缺陷分析等关键问题展开研究,提出了一种基于视频分析的视觉检测方法,并结合实际案例验证了该方法的有效性;其次,本文从算法设计角度出发,总结出该方法存在的不足之处及未来的研究方向。

(1)算法设计方面。首先,在算法实现过程中,应当考虑光照强度以及光源亮度变化情况,若光照强度过大或是光源亮度过小都会影响算法运行效果,进而导致算法无法正常运行。其次,为了提高算法运行速度和准确率,需要合理设置阈值,以便于后续计算结果的对比。再次,由于不同颜色代表着不同程度的灰度差异,因此可以通过RGB三通道分别提取图像的红绿蓝三个分量信息,然后将这三类色彩相加得到最终的图像。但是当光强度较大或者是光源亮度较小时,所提算法可能出现过度拟合现象,所以还需根据实际情况调整阈值。最后,在算法运行过程中,要保证每个像素点均有一个最佳阈值,这样才能使得算法具有良好的鲁棒性。

(2)算法性能评价指标。本文采用平均精度RMSE作为衡量算法性能的标准,该值越小说明算法的精确度越高;同时,也可利用MIC值来评估算法的稳定性,即当MIC值越大时,表明算法的稳定性越好。

(3)图像分割效果。图像分割效果主要包括两个方面:一是图像质量,二是图像分割结果。对于前者而言,可以从两幅图像之间的相似程度来判断,如果两张图像的边缘特征基本一致且纹理细节相差不大,那么就能够认为它们属于同一类别。而对于后者来说,则需通过对比两幅图像的灰度级和亮度对比度来确定其是否是同一幅图像。另外,还要考虑到图像分割时可能出现的噪声问题,如背景噪声、光照变化等因素都会影响图像分割结果。

综上所述,本文设计的基于视频分析的视觉检测算法不仅实现了对目标对象的识别,而且取得了不错的应用效果。

作者简介:

王俊鹏(1976-),男,湖北黄冈人,工程师,现就职于红安卷烟厂,主要研究方向为机械设计和故障维修。

蔡革英(1974-),男,湖北黄冈人,现就职于红安卷烟厂,主要研究方向为机械维修。

韩梅(1992-),女,湖北黄冈人,学士,现就职于红安卷烟厂,主要研究方向为质量管理。

参考文献:

[1] 李博. 基于视觉分析的物流传送带表面缺陷检测与定位系统研究[D]. 北京: 北京交通大学, 2020.

[2] Wen C Y, Chiu S H, Hsu W S, et al. Defect segmentation of texture images with wavelet transform and a co-occurrence matrix[J]. Textile Research Journal, 2001, 71 (8) : 743 - 749.

[3] CHEN M, DAI S. Analysis on image texture based on gray-level co-occurrence matrix[J]. Communications Technology, 2012(2): 108-111.

[4] 孔伟鑫. 基于全硬件的视频图像信号的二值化处理和边界坐标值存储[J]. 电子世界, 2014.

摘自《自动化博览》2024年4月刊

热点新闻

推荐产品

x
  • 在线反馈
1.我有以下需求:



2.详细的需求:
姓名:
单位:
电话:
邮件: