模式识别 第四版 pdf简单的两类识别问题

模式识别_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
评价文档:
阅读已结束,如果下载本文需要使用
想免费下载本文?
你可能喜欢模式识别之多类问题_图文_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
评价文档:
模式识别之多类问题
模​式​识​别​之​多​类​问​题
阅读已结束,如果下载本文需要使用
想免费下载本文?
你可能喜欢第3节 模式识别理论基础
更新于 22:29:45
&3.1 模式和模式识别的概念
3.1.1模式的概念
什么是模式呢?广义的说,存在于时间和空间中观察的事物,如果我们可以区别它们是否相同或是否相似,都可以称之为模式。但模式所指的不是事物本身,而是我们从事物获得的信息。因此,模式往往表现为具有时间或空间分布的信息。信息进入计算机之前通常要经过取样和量化,在计算机中具有时空分布的信息表现为向量即数组。数组中元素的序号可以对应时间与空间,也可以对应其他的标示。例如,医生根据各项化验指标判断疾病种类的模式识别过程中,各种化验项目并不对应时间或空间。因此,对于上面所说的时间与空间应作更广义、更抽象的理解。
人们为了掌握客观事物,按事物相似的程度组成类别。模式识别的作用和目的就在于面对某一具体事物时将其正确地归入某一类别。例如,数字&4&可以有各种不同的字体或写法,但它们都属于同一类,即使我们看到从未见过的某种写法的&4&,也能正确地将其分到&4&这一类别中。从不同的角度看人脸,视网膜上的成像也不同,但我们可以识别出这个人是谁,把所有不同角度的像都归入某个人这一类。如果给每个类命名,并且用特定的符号来表达这个名字,那么模式识别可以看成是从具有时间和空间分布的信息向着符号所作的映射。
通常,我们把通过对具体的个别事物进行观测所得到的具有时间和空间分布的信息称为模式,而把模式所属的类别和同一类中模式的总体称为模式类(或简称类)。也有人习惯于把模式类称为模式,而把个别具体的模式称为样本。
3.1.2模式识别的概念
一般来说,模式识别问题指的是对一系列过程或事件的分类与描述。要加以分类的一系列过程或事件可以是一系列物理的对象,或者是一些比较抽象的如心理状态。具有某些相类似的性质的过程或事件就分为一类。对于一个特定的问题,关于模式类的总数是由特定的应用所决定的。例如,考虑识别英文字母的问题,应该是一个26类的问题;对于本论文所研究的问题&&彩色城市地图道路识别与提取来说,由于地图的非路即区域的特征,这是一个两类的模式识别问题,即分类的结果是把地图图像像素分为道路和区域两类。对于某些问题,开始时可能并不知道到底有多少类,而需要观测许多具有代表性的模式之后才能决定。在这种情况下,我们需要查明,当我们观测越来越多的模式时,新的类别出现的可能性。
一种直观的吸引人的模式识别的方法是&模板匹配&法,对于这种情形,有一组模板或模型存在机器中,对于一个未知类别的输入模式,把它与每个类的模板加以比较,根据预先选定的匹配准则或者相似准则来加以分类。
&3.2 统计模式识别
有两种基本的模式识别方法,即统计模式识别方法和结构(句法)模式识别方法,与此对应的模式识别系统都由两个过程所组成,即设计和实现。设计是指用一定数量的样本(叫做训练集或学习集)进行分类器的设计,实现是指用所设计的分类器对待识别的样本进行分类决策。
3.2.1 基于统计方法的模式识别系统构成
基于统计方法的模式识别系统主要由4个部分组成:数据获取,预处理,特征提取和选择,分类决策,如图3.1所示。
图3.1 模式识别系统的基本构成
下面对这几个部分作一个简单的介绍。
1、数据获取
为了使计算机能够对各种现象进行分类识别,要用计算机可以运算的符号来表示所研究的对象。通常输入对象的信息有下列3种类型,即
(1)二维图像 如文字、指纹、地图、照片这类对象。
(2)一维波形 如脑电图、心电图、机械振动波形等。
(3)物理参量和逻辑值 前者如在疾病诊断中病人的体温及各种化验数据等;后者如对某参量正常与否的判断或对症状有无的描述,如痛与不痛,可用逻辑值即0和1表示。在引入模糊逻辑的系统中,这些值还可以包括模糊逻辑值,比如很大、大、比较大等。
通过测量、采样和量化,可以用矩阵或向量表示二维图像或一维波形。这就是数据获取的过程。
预处理的目的使去除噪声,加强有用的信息,并对输入测量仪器或其他因素所造成的退化现象进行复原。
3、特征提取和选择
由图像或波形所获取的数据量是相当大的。例如,一个文字图像可以有几千个数据,一个心电图波形也可能有几千个数据,一个卫星遥感图像的数据量就更大。为了有效的实现分类识别,就要对原始数据进行变换,得到最能反映分类本质的特征。这就是特征提取和选择的过程。一般我们把原始数据组成的空间叫测量空间,把分类识别赖以进行的空间叫做特征空间,通过变换,可把在维数较高的测量空间中表示的模式变为维数较低的特征空间中表示的模式。在特征空间中的一个模式通常也叫做一个样本,它往往可以表示为一个向量,即特征空间中的一个点。
4、分类决策
分类决策就是在特征空间中用统计方法把被识别的对象归为某一类别。基本做法是在样本训练集基础上确定某个判决规则,使按这种判决规则对被识别的对象进行分类所造成的错误识别率最小或引起的损失最小。
3.2.2 统计模式识别之几何分类法
正如图3.1所示,统计模式识别方法最终归结为分类问题。假如抽取出N个特征,而图像可分为m类,那么就可以对N进行分类,从而决定未知图像属于m类中的哪一类。一般把识别模式看成是对N维空间中的向量X进行分类,即:
模式类别为。识别就是要判断X是否属于wi以及xj属于wi中的哪一类。在这个过程中主要解决两个问题:一是如何抽取特征,要求特征数N尽可能小而对分类判断有效;二是假设已有了代表模式的向量,如何决定它属于哪一类,这就需要判别函数。例如,模式有共个类别,则应有,共m个判别函数。如果X属于第i类,则有:
在两类的分界线上,则有
这时X既属于第i类,也属于第j类,因此这种判别失效。为了进行识别就必须重新考虑其他特征,再进行判别。问题的关键是找到合适的判别函数。
1、线性判别函数
线性判别函数是应用较广泛的一种判别函数。所谓线性判别函数是指判别函数是图像所有特征量的线性组合,即:
为常数项或称为阈值。在两类之间的判决界处有下面的形式:
该方程在二维空间中是直线,在三维空间中是平面,在N维空间中则是超平面。
可以写成下面的形式:
其判决过程如下进行:
用线性判别函数进行分类的是线性分类器。任何m类问题都可以分解为(m-1)个二类识别问题。方法是先把模式空间分为1类和其他类,如此进行下去即可。因此,最简单和最基本的是两类线性分类器。
在线性分类器中要找到合适的系数,以便可以使分类尽可能不出差错,唯一的办法就是试验法。例如,先设所有的系数为1,送进每一个模式,如果分类有错误就调整系数,这个过程就叫做线性分类器的训练或学习。例如,我们把N个特征X和1放在一起叫做Y,N+1个系数为W,即:
考虑分别属于两个不同模式类,m=1,此时,有两个训练集T1和T2。两个训练集合是线性可分的,这意味着存在一个加权向量W,使得
式中YT是Y的转置。
如果分类器的输出不能满足上式的条件,可以通过&误差校正&的训练步骤对系数加以调整。例如,如果第一类模式YTW不大于零,则说明系数不够大,可用加大系数的方法进行误差修正。具体修正方法如下:
通常使用的误差修正方法有固定增量规则,绝对修正规则及部分修正规则。规定增量规则是选择为一个固定的非负数。绝对修正规则是取为一个最小整数,它可使YTW的值刚好大于零,即
部分修正规则可取为下式所决定的值
2、最小距离分类器
线性分类器中重要的一类使用输入模式与特征空间中作为模板的点之间的距离作为分类的准则。假设有m类,给出m个参考向量与模式wi相联系。对于Ri的最小距离分类就是把输入的新模式X分为wi类,其分类准则就是X与参考模式原型之间的距离,与哪一个最近就属于哪一类。X与Ri之间的距离可表示为
由上式得:
由此可设定最小距离判别函数
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&& (3.2.1)
由上面的判别函数可知,在分类中,如果。最小距离分类器也是一个线性分类器。在最小距离分类中,在决策边界上的点与相邻两类都是等距离的,这种方法就难于解决,此时必须寻找新的特征,重新分类。
3、最近邻域分类法
最近邻域分类法是图像识别中应用较多的一种方法。在最小距离分类法中,取一个最标准的向量作为代表。将这类问题稍微扩展一下,一类不能只取一个代表,把最小距离的概念从一个点和一个点的距离扩充到一个点和一组点之间的距离。这就是最近邻域分类法的基本思路。设分别是与类相对应的参考向量的m个集合,在Ri中的向量为,,也就是
输入特征向量X与Ri之间的距离用下式表示:
这就是说,X和Ri之间的距离是X和Ri中每一个向量的距离的最小者。如果X与之间的距离由式(3.2.1)确定,则其判别函数为
其中是特征的线性组合,决策边界将是分段线性的。
如果有一个模式送入识别系统,首先要计算它与每个点的距离。这种方法的概念简单,分段线性边界可以代表很复杂的曲线,也可能本来是非线性边界,现在可用分段线性来近似代替。
4、非线性判别函数
线性判别函数很简单,但也有缺点。它对于较复杂的分类往往不能胜任。在较复杂的分类问题中就要提高判别函数的次数,因此根据问题的复杂性,可将判别函数从线性推广到非线性。非线性判别函数可写成如下的形式:
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&& (3.2.2)
式(3.2.2)是一个二次型判别函数。通常二次型判别函数的决策边界是一个超二次曲面。
3.2.3 统计模式识别之统计分类方法
前面谈到的分类方法是在没有噪声干扰的情况下进行的,此时测得的特征的确能够代表模式。如果在抽取时有噪声,那么可能抽取的特征代表不了模式,这时就要用统计分类法。用统计分类法对图像进行特征抽取、学习和分类是研究图像识别的主要方法之一,而统计方法的最基本内容之一是贝叶斯(Bayes)分析,其中包括贝叶斯决策方法、贝叶斯分类器、贝叶斯估计理论、贝叶斯学习、贝叶斯距离等等。
1、贝叶斯公式
在古典概率中就已有大家所熟悉的贝叶斯定理:
式中是n个互不相容的事件,的先验概率,是A在Bi已发生条件下的条件概率。贝叶斯定理说明在给定了随机事件的各先验概率及条件概率时,可计算出事件A的出现时事件Bi的后验概率。
贝叶斯公式常用于分类问题和参数估计值问题中。假如X表示事物的状态或特征的随机变量,它可以代表图像的灰度或形状等;设wi代表事物类别的离散随机变量。对事物进行分类就可以用如下的公式:
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&& (3.2.3)
式中P()称为的先验概率,它表示事件属于预先粗略了解;P(X|)表示事件属于类而具有X状态的条件概率;P(|X)叫做X条件下的后验概率,它表示对事件X的状态作观察后判断属于的可能性。由式(3.2.3)可见,只要类别的先验概率及X的条件概率已知,就可以得到类别的后验概率。再加上最小误差概率或最小风险法则,就可以进行统计判决分类。
在参数估值问题中,贝叶斯公式中的二个变量常常为连续随机变量,如果写作变量X及参数,则有如下的公式:
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&& (3.2.4)
通过式(3.2.4),由参数的先验分布p()及预先设定的条件分布p(X|),即可求得参数的后验分布p(|X)。贝叶斯公式是参数估值的有力工具。
2、贝叶斯分类法
假设有两类,每类用两种统计参数代表,即
其中是先验概率,是条件概率密度函数。在噪声的不确定的影响下,每个模式已不能用一个向量来表示,因此,只能得到某一类模式的概率分布。
如果用贝叶斯规则的话,结果是
&3.3句法结构模式识别
统计模式识别法是模式识别中应用较广泛的一种方法。它的基本做法是首先从待识别模式中提取特征参数,然后用这些特征参数把模式表达为特征空间中的点,然后在根据各点之间的距离进行分类和识别。这种识别方法对结构复杂、形式多变的模式来说存在着一系列的困难。首先对比较复杂的模式需要较多的特征才能描述它,而特征提取是比较困难的环节,对于同一模式往往有不同的抽取方法,就目前来看尚没有统一的理论依据。其次,简单的分类并不能代表识别,对于复杂的模式,在这方面统计决策法就有极大的局限性。近几年发展起来的句法结构模式识别法主要着眼于模式结构,采用形式语言理论来分析和描述模式结构,因此,它具有统计模式识别法所不具有的优点。所以句法结构模式识别是一种颇受重视的近代识别方法。
3.3.1形式语言描述
所谓句法结构就是将一个复杂的模式一部分一部分地加以描述,将复杂的模式分成若干子模式,如此分下去直至最简单的子模式(亦称基元)为止。这是一种树状结构的表示方法。这种方法类似于语言分析中的句法结构,因此,把这种着眼于结构的模式识别方法叫做结构模式识别。在结构模式识别中句法结构是借助于形式语言(数理语言)进行描述的。
1、形式语言的几个基本定义
(1)字母表(词汇表)
字母在形式语言中被定义为与问题有关的符号集,例如:
等都是字母表的例子。
(2)句子(链)
这是字母表中的符号组成的有限长的符号串。例如:ABBA,,under,horse等都是句子。
语言是字母表组成的句子的集合。例如:
语言可分成有限的和无限的,上例中,L1是有限的,L2是无限的。
文法是一种语言构成句子所必须遵守的规则的有限集。
它是由字母表的符号组成的所有句子的集合,当然,也包括空句子在内。
它不包括空句子在内的所有句子的集合。
2、树状结构中语言分析及其四个基本要素
利用上述定义可以分析一个英文句子,如:&The gril smiles sweetly&,利用形式语言可把句子表示成图3.2所示的树状结构。
图3.2 语言分析中的树状结构
(1)终止符
例如:树状结构中的&The, girl, smiles, sweetly&均是终止符。
(2)非终止符
例如:&Sentence&, &Noun Phrase&等是非终止符。
(3)产生式(或称为重写规则)
(4)起始符。
例如:&Sentence&。
以上四元素就构成了文法,有了文法就可以构成句子,每一个句子都必须遵循文法规则。
3、句法结构文法
由前面的四元素可以构成短语结构文法。短语结构文法为一个四元式。即:
3.3.2句法结构方法
图3.3是句法结构模式识别法的系统方框图。它由识别及分析两部分组成。识别部分包括预处理、基元抽取和结构分析。预处理主要包括编码、滤波、增强及隙缝填补等一系列操作。基元抽取包括分割、特征(基元)抽取。这部分在分割的过程中抽取基元并显示基元相互关系,以便利用子模式进行描述,所以基元不一定是模式的一部分,与统计模式识别中特征提取稍有不同,基元的选择要考虑容易识别,所有基元不一定是模式中最小的元素。基元的选择要尽可能少,而且容易被识别。
结构分析是指&结构分析器&。它可判别所得到的表达式在句法上是否正确。如果句法是正确的,就能得到模式的完整描述。
图3.3 句法结构模式识别方法系统结构图
图3.3的分析部分包括基元选择及结构推断。模式分析是为模式识别服务的。基元选择提供参考模式基元,供识别部分作为匹配模板用,以完成识别任务。
一类模式可以用一个文法来表示,在机器中只存文法就可以了。简单的文法目前可由机器来作文法推断,较复杂的实用文法尚需人和机器配合来推断。
基元选择和结构推断是相互关联的,基元选择得复杂一些,句法结构就可简单些;反之亦然。
根据模式的不同,模式结构的表示方法也有所不同。一维模式大都用一维链来描述。对于二维的模式,关系就复杂了。所以,句法模式识别推广到多维时,形式语言就不适用了,需要加以推广,以适应识别的需要。
关于模式结构的表示方法,一维图形用链码串,多维模式则用树图结构。
句法方法在以下邻域多有应用:
(1) 波形分析
(2) 声音识别与理解
(3) 文字识别
(4) 二维数学表达式
(5) 指纹分类
(6) 图像分析与理解
(7) 机器部件识别
(8) 自动视觉检查
(9) LANDSAT资源勘探用陆地卫星数据理解。
&3.4 特征选择与提取
在模式识别中,特征的选择与提取是非常重要的,它强烈的影响着后面的分类器的设计及其性能。假使对不同类别这些特征差别很大,那就比较容易设计出具有较好性能的分类器。因此,特征选择是模式识别中的一个关键问题。由于在很多实际问题中常常不容易找到那些最重要的特征,或受条件限制不能对它们进行测量,这就使特征选择和提取的任务复杂化而成为构造模式识别系统最困难的任务之一。
特征选择与提取的基本任务是如何从许多特征中找出那些最有效的特征。因此研究如何把高维特征空间压缩到低维特征空间以便有效的设计分类器就成为一个重要的课题。任何识别过程的第一步,不论用计算机还是由人去识别,都要首先分析各种特征的有效性并选出最有代表性的特征。显然特征选择和提取这一任务应在设计分类器之前进行。
可以把特征分为三类:①物理的,②结构的,③数学的。人们通常利用物理和结构特征来识别对象,因为这样的特征容易被视觉、触觉以及其他感觉器官所发现。但在使用计算机去构造识别系统时应用这些特征有时比较复杂,因为一般来说来用硬件去模拟人类感觉器官是很复杂的,而机器在抽取数学特征的能力方面则又比人强得多。这种数学特征的例子有统计平均值、相关系数、协方差矩阵的本征向量等等。
我们讨论的重点是根据学习样本来选择并提取数学特征。物理和结构特征的测量及其有效性的分析和具体对象联系十分密切,涉及到研究对象本身的各种物理规律,因此这里不对它们进行专门讨论。应当指出,在很多实际问题中,物理和结构特征对分类是非常重要的,在实际构造一个识别系统时常常把它们作为基本特征而用到分类器的设计中。
在大多数情况下,不能直接在测量空间中进行分类器的设计,一方面是因为测量空间的维数很高,不适宜于分类器的设计,更重要的是这样一种描述并不能直接反映对象的本质。因此,为了进行分类器的设计,需要把图像从测量空间变换到维数大大减少的特征空间,被研究的图像或现象在这个特征空间中就由一个特征向量来表示。
实际上这样一种变换常常分成几个步骤进行,以下对几个常用的术语作些说明。
特征形成 根据被识别的对象产生出一组基本特征,它可以是计算出来的(当识别对象是波形或数字图像时),也可以是用仪表或传感器测量出来的(当识别对象是实物或某种过程时),这样产生出来的特征叫做原始特征。
特征提取 原始特征的数量可能很大,或者说样本是处于一个高维空间中,通过映射(或变换)的方法可以用低维空间来表示样本,这个过程叫特征提取。映射后的特征叫二次特征,它们是原始特征的某种组合(通常是线性组合)。所谓特征提取在广义上就是指一种变换。若Y是测量空间,X是特征空间,则变换 就叫做特征提取。
特征选择 从一组特征中挑选出一些最有效的特征以达到降低特征空间维数的目的,这个过程叫特征选择。
以细胞自动识别为例,通过图像输入得到一批包括正常及异常细胞的数字图像,我们的任务是根据这些图像区分哪些细胞是正常的,哪些是异常的。首先要找出一组能代表细胞性质的特征。为此可以计算细胞总面积、总光密度、胞核面积、核内纹理等,这样可得到很多原始特征,这一过程就是特征的形成。这样产生出来的原始特征可能很多,或者说原始特征空间维数很高,需要压缩维数以便分类。一种方式是用映射(或称变换)的方法把原始特征变换为较少的新特征,这就是特征提取。另一方式就是从原始特征中去挑选出一些最有代表性的特征来,这就是特征选择。最简单的特征选择方法是根据专家的知识挑选那些对分类最有影响的特征,另一个可能则是用数学的方法进行筛选比较,来找出最有分类信息的特征。
有时特征提取和选择并不是截然分开的。例如,可以先将原始特征空间映射到维数较低的空间,在这个空间中再进行选择以进一步降低维数。也可以经过选择去掉那些明显没有分类信息的特征,再进行映射以降低维数。
&3.5 聚类分析
统计分类方法是用已知所属类别的样本,设计出判别函数,再用此函数来对未知样品分类的方法。这些已知类别的样本,亦称训练集,根据训练集进行分类的方法,称为有教师的分类法。
本节将研究在没有训练集的情况下的样品分类问题,亦即在设计分类器时,所采用的样品并不知其所属类别,而是根据样品间的相似程度来自动的进行分类。这符合中国的一句成语&物以类聚,人以群分&。故Cluster这一英语名词亦被译作&集群&。这是一种无教师的分类法。
3.6.1聚类准则
设有未知类别的n个样品,要把它们划分到C个类别中去,可以有多种优劣不同的聚类方法,怎样评价聚类的优劣,这就需要确定一种聚类准则。但是客观的讲,聚类的优劣是就某种评价函数而言的,很难有对各种准则均呈优良表现的聚类方法。
聚类准则的确定,基本上有两种方法。一种是凭经验,根据所分类的问题,确定一种准则,并用它来判断样品的分类是否合理。例如以距离作相似性的度量,用不断修改阈值,来探究对此种准则的满足程度。另一种是定一种准则函数,其函数值与样品的划分有关。当取得极小值时,就认为得到了最佳划分。
下面给出一种最简单而又广泛应用的准则。误差平方和准则:
设有n个样品,分属于类,设具有个样品的类,其均值为
定义误差平方和
因为有若干种方法可将n个样品划归到C类中去。因此对应一种划分,可求得一个误差平方和J,我们的目的则是要找到使J值最小的那种划分。
3.6.2 基于试探的聚类算法
选定一种聚类准则之后,就可对样品群的每一种分类,计算出一个J值。不断改变分类法,就可算得一系列J值,其中对应于J值最小的分类,就被认为是最佳分类。但这样做显然会浪费不少计算量,因此需要寻找一些算法,以有效的得到最佳分类。
1、基于最邻近规则的试探法
设有n个样品:,不妨令任一样品作为聚类中心Z1,并选取任一非负的阈值T,为方便起见,我们选X1=Z1,然后计算X2到Z1的距离D21,若D21&T,则建立一新的聚类中心Z2,且X2=Z2,若D21&T,则认为X2在以Z1为中心的域中,即X1,X2同属一类。
然后分别计算X3到Z1,Z2的距离,得到D31,D32,若D31&T,D32&T,则建立一新的聚类中心Z3,且X3=Z3,否则将X3划分到最近的聚类中心的域中。
用类似的方法对所有的样品计算距离,比较阈值,决定归属。当算法结束时,就能得到C个类,C个聚类中心,以及每一类中的样品数。
可以看出这种算法的结果与第一个聚类中心的选取,样品的排列次序,阈值T的大小,以及样品分布的几何特征有关(当选用欧氏距离之类的函数做距离测度时)。
这种方法的优点时计算简单,当具有关于模式集合分布的先验知识,以指导阈值及初始点的选取时,可以较快地获得合理的聚类结果。
2、最大最小距离算法
这种算法是以欧氏距离为基础的,它除了首先辨识最远的聚类中心,与上述算法相似。图3.3为10个样品的分布,下面示出如何利用最大最小距离算法对该样品集进行分类。
图3.3 最大最小距离算法举例
第一步:任意地令X1为第一个聚类中心,即X1=Z1。
第二步:确定离X1最远的样品,此例中是X6,令X6=Z2。
第三步:逐个计算各样品与Z1,Z2间的距离Di1,Di2:
转第四步。否则转最后一步。
最后一步:将全部样品按最近距离分到最近的聚类中心。
这一结果同图中看到的结果是一致的。
本论文利用该算法去除地图中的符号,取得了比较好的效果。如图3.4所示。
图3.4 利用最大最小距离算法去除地图中的符号
图3.4(a)为合肥城市交通地图的一部分,图中的红十字符号&&对地图道路提取有很大的影响,因此首先必须去除之。图3.4(b)显示出用最大最小距离算法去除地图中的符号后的结果,图3.4(a)中的符号被图3.4(b)中的黑色小方块替代,于是就达到了去除符号的目的。
用最大最小距离法去除图3.4(a)中的红十字符号&&的具体过程如下:
(1)由于我们所研究的地图是彩色的,所以我们很容易提取红十字符号的颜色信息,设其值为RedColor。(2)逐行扫描地图图像,如果某像素的颜色值与RedColor的值相差不超过预先设定一个比较小的阈值的话,记下该像素在图像中的位置(坐标)并存放到一个数组RedPixelArray中。(3)得到这个位置数组后,我们可以利用上面的最大最小距离算法对该数组中的元素进行分类,如果有某一些元素(假设存放在数组RedCross中)相互之间的距离不超过一个阈值的话,我们就认为这些元素构成一类,具体在图像中,就是这些元素表示位置处的像素构成一个红十字符号。(4)由于数组RedCross存放的是坐标值,我们可以求出数组元素的水平方向的最大最小值MaxX和MinX,垂直方向的最大最小值MaxY和MinY。(5)利用这四个值画出一个方框,然后在用黑色的像素或区域的像素来填充这个方框,于是方框内部的&红十字&符号也就去除了。
与非门科技(北京)有限公司 All Rights Reserved.
京ICP证:070212号 北京市公安局备案编号: 京ICP备:号模式识别总览PPT_图文_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
评价文档:
模式识别总览PPT
模​式​识​别​总​览​P​P​T
阅读已结束,如果下载本文需要使用
想免费下载本文?
你可能喜欢}

我要回帖

更多关于 模式识别 第四版 pdf 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信