禁要:由于受到胃部蠕动、气泡、食物、光照以及图像采集过程中摄像头移动等因素影响,电子胃镜图像存在亮度变化较大等问题,常用的计算机辅助分析方法雄以取得理想的效果。针对该问题,在分析电子胃镜图像特点的基础上,提出一种电子胃镜图像病灶良恐性识别方法。在不同颜色通道中使用结合局部二元模式算法,提取其纹理特征向量,分别输入支持向量机进行训练和识别,对不同颜色空间的识别结果采用投票原则确定最终结果。实验结果表明,该方法的识别率达到92.2%。
1概述
胃癌是世界范围内最常见的恶性肿瘤之一,据2000年资料统计,全球每年新发胃癌87万例,占所有新发癌症病例的9%,仅次于肺癌、乳腺癌和肠癌,居第4位。每年约有64万人因胃癌死亡,居癌症死因的第2位。就胃癌而言,早期胃癌术后的5年生存率可达95%~99%,而进展期病例的5年生存率却不超过50%1-],因此及时发现早期胃癌对于提高胃癌的治疗效果具有十分重要的意义。胃镜检测是发现早期胃癌的最直接方法,采用计算机辅助诊断方法,通过对胃镜图像的数学分析,为临床诊断提供依据是目前早期胃癌诊断研究的一个方向1。图1是上海交通大学附属瑞金医院消化内科在临床诊断过程中所采集的部分病人电子胃镜图像。
其中,图1(a)为早期肿瘤图像,图1(b~图1(d)分别为常见的胃溃疡、糜烂和疣状胃炎对应图像。从图像中可以看到由于采集过程光照等因素影响,电子胃镜图像的亮度变化较大,同时,胃部气泡和残留食物的干扰严重影响到早期胃癌图像的识别,要实现电子胃镜病灶的良恶性识别,必须有一个可以避免胃部无用物质干扰同时能在不同亮度情况下均能取得良好效果的特征提取方法。
2电子胃镜病灶良恶性识别
本文所采用的识别方法如图2所示。
在分析电子胃镜图像特点的基础上,本文提出基于局部二元模式(Local Binary Pattern,LBP)算法的电子胃镜图像良恶性病灶识别方法,提取电子胃镜图像在不同颜色通道的分量,并将其转化为灰度图像,采用LBP算法提取其统计特征作为纹理特征向量,分别采用SVM进行训练和识别,对各通道识别的结果采取投票原则确定最终的识别结果。
2.1色彩空间融合
相比灰度图像来说,彩色图像能为临床医生的判断提供更多的信息,电子胃镜即为彩色图像。然而LBP算法是基于灰度级别的算法,如果将彩色图像转化为单一灰度图像处理,这必然会丢失很多重要信息。因此,本文采用色彩空间融合的方法,在R,GB色彩通道分别采用LBP算法提取胃镜图像纹理特征输入SVM进行训练与识别,对各通道的识别结果采用投票选择的方法来确定彩色胃镜图像的识别结果。
2.2纹理分析方法
由于受胃部蠕动、气泡、食物、光照以及胃镜采集图像过程中摄像头移动等因素的影响和胃镜图像本身亮度变化较大等问题,常用的计算机辅助分析方法难以取得理想的效果15]。
图像的纹理反映了图像灰度模式的空间分布,包含图像的表面信息及其图像灰度和统计信息等,兼顾图像的宏观与微观结构,胃镜图像的分析可以采用纹理特征分析来实现,纹理分析主要有共生矩阵(6]、Markov 随机场模型(1、Gabor小波变换1]等方法。共生矩阵方法考虑了像素间的相互关系。
不同距离产生不同的共生矩阵,对于给定距离,利用共生矩阵产生一系列纹理特征,需要大量的统计数据,在不同的灰度尺度和亮度情况下所取得的效果相差很大。Markov随机场模型首先确定Markov随机场模型的阶数和模型的形式,然后确定它的参数,但参数的估计困难,运算量较大。Gabor小波变换引入了多尺度多分辨率的概念,在不同尺度上进行纹理分析,可以获得不同纹理特征,增加了信息量。小波函数有较大的选择范围,但运算量也较大。
文献[9]提出了基于LBP的一种纹理描述算子,具有能处理不同灰度尺度图像、不受图像旋转等干扰优点,近几年被广泛地应用于医学图像处理领域。
2.3局部二元模式
通过图3和式(1)、式(2),可知LBP算法的运算机理。
其中,g。为中心像素值;g。为圆周上相应的取值。
图3是N=8,R=1的情况。参数组(N,R)表示在以g为圆心、R为半径的圆上取N个点的像素值用来计算LBP值,
8。对应的坐标为(ga+Rcos(2m/N),g。+Rsin(2m/N),ge和g。分别表示g.的横坐标和纵坐标,在坐标不是整数的情况下,通过周围领域的像素值进行双线性插值求得该坐标的像素值。
图4是不同参数组(N,R)对应的情况。
通过该算法,很容易得到一些纹理信息,图5中从左至右分别代表暗点或平滑区域、边缘和亮点,其LBPw)值分别为:00000000,11000011,11111111。
通过图3可以直观地看到,图像旋转后,其每个子块的LBP值都会相应发生改变,从而影响其LBP描述,这为图像的特征提取和分类造成很大麻烦。文献[10]在文献[9]工作的基础上提出一种改进的方法,该方法通过求取各旋转角度上的LBP最小值来获取LBP算子的旋转不变性,如式(3)所示:
其中,ROR(LBPNA),)表示将二进制数组LBPx.A)向右圆周平移i位。形象地说,式(3)表示将图像子块顺时针旋转,取其LBPvx)的最小值作为最终的LBP值。
由于LBP以某个像素为中心的图像子块作为计算对象来考虑,从式(1)可知LBP在运算时,只考虑图像子块中圆周像素g。与中心像素g。的差,并通过取值窗口(图像子块)在图像上的平移来遍历整幅图像,取得图像的LBP运算结果。因此对于不同亮度的图像,尤其是亮度较弱的图像处理,能取得良好的效果。而通过参数组(WN,R)的选取使得LBP适用于多灰度级、多尺度图像的分析。
从式(3)可以看出,LBPAA)算子在保留LBP算子不受图像亮度和分辨率变化影响的基础上,通过图像子块的旋转获取最小二进制描述,从而具有不受图像旋转的优点。胃镜图像的纹理特征提取最终要为学习机器提供最好的训练和识别样本,特征提取算法的选择影响到学习及其最终识别精度。本文选取改进的LBP算法作为特征提取方法来避免图像采集角度和光照强度带来的影响。
2.4统计特征提取
灰度共生矩阵是最常用的统计纹理分析方法,但是该方法运算量大,在面对亮度变化较大的样本识别时,准确率不高。灰度直方图是描述图像灰度值分布情况的一种方法,其横坐标是灰度值,纵坐标是该灰度值出现的概率。设图像灰值量化为L个灰度值,令i=0,1…,L-1,第i个灰度值的像素总数为N(i),而整幅图像的像素总数为M,那么,灰级i出现的概率为
根据图像的灰度直方图,可得到一系列图像统计特征:
(1)图像的R阶距
为了以最小运算代价来取得最高识别准确率,在本文方案中,电子胃镜图像在各颜色通道的分量经过LBP算法后,选取图像均值、方差和嫡作为统计特征向量输入支持向量机进行训练和识别。
2.5支持向量机
支持向量机(Support Vector Machine,SVM)是由文献[11]
提出的一种基于统计学习理论的机器学习方法。它通过结构风险最小化原则以及核函数方法,自动寻找那些对样本有较好区分能力的支持向量,由此构造出的超平面可以最大化类间间隔,并且具有较好的推广性和较高的分类准确率。因此,本文选用SVM作为分类工具来进行胃镜图像中的良恶性病变组织识别。
2.6投票原则
彩色图像在RGB颜色通道中的值并不呈线性关系[2],在不同颜色通道中,分类器的识别性能有一定差别,因此,有必要采取方案对3个颜色通道的识别和训练进行比较以确定最终彩色图像的识别结果。投票原则是多通道、多分辨率和多分类器集成识别过程中较多使用的方法,其基本思想是通过投票的方式决定分类器输出结果不一致时的模式类别。投票规则源于一种假设:群体的判断优于个体的判断]。本文将R,GB3个颜色通道分别进行LBP运算、特征提取和训练/识别,对3个颜色通道的识别结果采用“一人一票”的方法,以少数服从多数的原则确定彩色图像的识别结果。
3实验与分析
本文选用上海交通大学医学院附属瑞金医院消化内科临床胃镜检查所采集的电子胃镜图像。其中,训练图像含良性病变30例,早期胃癌35例,图像分辨率为640×480,测试集合由随机选取的50位病人电子胃镜图像组成,共200幅,分辨率为640×480,选用32×32的窗口截取子图像样本量作为样本进行训练和识别,共19500个训练样本,60000个测试样本。所用计算机CPU为Pentium(R),主频3.0GHz,内存1GB。
通过医生浏览图像,手动勾画出恶性肿瘤区域,对于每个样本,确定LBP算子的(W,R)参数组值为(8,1),分别对子图像的R,GB颜色分量进行LBP运算后,将其均值、方差和嫡作为纹理特征向量,采用医生的判断作为先验知识为纹理特征向量确定标记值,作为SVM的训练样本进行训练。
在图像识别过程中,采取同样的方法,提取纹理特征输入SVM进行识别,将LBP方法与其他特征提取方法进行对比实验,结果如表1所示。结果表明,本方法在胃镜图像良恶性识别问题上,具有较强的分辨能力,同时在运行速度上也有较强的优势。同时也注意到,在对少量未能准确识别的样本进行分析之后得知,在图像识别过程中均存在气泡、胃中食物等无用信息干扰较为严重的问题,因此,为提高识别准确率,可利用边缘检测和频谱分析相结合的方法,将无用信息和有用信息区分开来1],再用本文方法单独处理有用信息。
4结束语
本文将LBP算法应用到胃镜图像的识别领域,提出采用提取图像RGB分量的LBP统计特征作为胃镜图像的纹理特征,并采用SVM进行识别,取得了良好的效果,实验结果显示,该算法在良恶性肿瘤胃镜图像的识别中是合理可行的。