遥感分类算法
‘壹’ 遥感影像监督分类有什么好的方法
根据已知训练区提供的样本,通过计算选择特征参数,建立判别函数以对各待分类影像进行的图像分类
监督分类 (supervised classification)又称训练场地法,是以建立统计识别函数为理论基础,依据典型样本训练方法进行分类的技术。即根据已知训练区提供的样本,通过选择特征参数,求出特征参数作为决策规则,建立判别函数以对各待分类影像进行的图像分类,是模式识别的一种方法。要求训练区域具有典型性和代表性。判别准则若满足分类精度要求,则此准则成立;反之,需重新建立分类的决策规则,直至满足分类精度要求为止。常用算法有:判别分析、最大似然分析、特征分析、序贯分析和图形识别等。
过程:
1、选择训练区(代表性,完整性,多个样区)
2、提取统计信息(进行多元统计分析,训练样本的有效评价,样本纯化)
3、选择合适的监督分类算法(平行算法,最小距离法,最大似然法(至今应用最广),波谱角分类法)
4、计算机自动分类
5、分类精度评价(非位置精度,位置精度--混淆矩阵)
优点:
1、 可充分利用分类地区的先验知识,预先确定分类的类别;
2、 可控制训练样本的选择,并可通过反复检验训练样本,以提高分类精度,避免分类中的严重错误
3、 避免了非监督分类中对光谱集群组的重新归类。
缺点:
1、人为主观因素较强;
2、训练样本的选取和评估需花费较多的人力时间;
3、只能识别训练样本中所定义的类别,从而影响分类结果。
‘贰’ 面向遥感图像分类基于注意力机制,你有哪些了解算法
传统的基于像素的遥感图像处理方法是基于遥感图像丰富的光谱信息和地面物体之间明显的光谱差异。对于只有几个波段的高分辨率遥感影像,传统的分类方法会导致分类精度降低和大量的空间数据冗余,分类结果往往是椒盐图像,不利于进行空间分析。为了解决这一传统问题,模糊分类技术应运而生。模糊分类是一种图像分类技术,它将任何范围的特征值转化为0到1之间的模糊值,表示属于某个指定类别的程度。
除此以外,所有这些背景信息在图像分析中都非常重要,例如,城市绿地与一些湿地在光谱信息上相当相似,只要在面向对象的图像分析中明确城市绿地的背景为城市地区,就可以很容易地区分绿地和湿地,在基于像素的分类中,几乎不使用这种背景信息。面向对象的图像分析技术是在空间信息技术的长期发展过程中产生的,在遥感图像分析中具有很大的潜力。
到目前为止,面向对象的方法是一种比较理想的方法,可以建立一个与现实世界相匹配的地面模型。面向对象的处理方法中最重要的部分是图像分割。随着地球观测任务的逐步细化,高分辨率的遥感卫星图像得到了越来越广泛的应用。这给遥感图像分类方法带来了挑战。现有的研究表明,基于像素的高分辨率遥感图像分类存在着明显的局限性。近年来,基于对象的图像分析(OBIA)被认为是遥感和地理信息科学的一个重要趋势,在高分辨率遥感图像处理中变得越来越突出。
‘叁’ 遥感图像分类方法的比较 谁会
感图像的统计参数在图像处理过程中的作用:主要有以下7个参数:反差,方差,均值滤波,中值,众数,协方差,相关系数.它们对遥感数字影响 处理骑到举足轻重的作用:它们的主要用途及功能:相关系数是变量之间相关程度的指标。样本相关系数用r表示,总体相关系数用ρ表示,相关系数的取值范围为[-1,1]。|r|值越大,误差Q越小,变量之间的线性相关程度越高;|r|值越接近0,Q越大,变量之间的线性相关程度越低。γ>0为正相关,γ<0为负相关。γ=0表示不相关;γ的绝对值越大,相关程度越高。如两者呈正相关,r呈正值,r=1时为完全正相关;如两者呈负相关则r呈负值,而r=-1时为完全负相关。完全正相关或负相关时,所有图点都在直线回归线上;点子的分布在直线回归线上下越离散,r的绝对值越小。两个不同参数之间的方差就是协方差若两个随机变量X和Y相互独立,则E[(X-E(X))(Y-E(Y))]=0,因而若上述数学期望不为零,则X和Y必不是相互独立的,亦即它们之间存在着一定的关系。协方差作为描述X和Y相关程度的量,在同一物理量纲之下有一定的作用,但同样的两个量采用不同的量纲使它们的协方差在数值上表现出很大的差异。均值滤波是典型的线性滤波算法,它是指在图像上对目标像素给一个模板,该模板包括了其周围的临近像素(以目标象素为中心的周围8个象素,构成一个滤波模板,即去掉目标象素本身)。再用模板中的全体像素的平均值来代替原来像素值。均值滤波也称为线性滤波,其采用的主要方法为领域平均法。线性滤波的基本原理是用均值代替原图像中的各个像素值,即对待处理的当前像素点(x,y),选择一个模板,该模板由其近邻的若干像素组成,求模板中所有像素的均值,再把该均值赋予当前像素点(x,y),作为处理后图像在该点上的灰度个g(x,y),即个g(x,y)=1/m ∑f(x,y) m为该模板中包含当前像素在内的像素总个数。 组中值:上限与下限之间的中点数值称为组中值,它是各组上下限数值的简单平均,即组中值=(上限+上限)/2。组中值经常被用以代表各组标志值的平均水平。分组中通常把上下两端的组运用开放式的组距,即第一组用"多少以下",最后一组用"多少以上"表示,这两个组的组中值可参照相邻组的组距来决定。众数: 理性理解:简单的说,就是一组数据中占比例最多的那个数。 用众数代表一组数据,可靠性较差,不过,众数不受极端数据的影响,并且求法简便。在一组数据中,如果个别数据有很大的变动,选择中位数表示这组数据的“集中趋势”就比较适合。反差:1、反差指不同事物或同一事物的不同方面对比的差异程度。 2、反差指负片或照片上的明暗对比的术语。明暗对比大,则说明反差大。当反差大时,说明照片是硬调的。 3、反差指景物或影像中各部分明暗对比的差异程度。分景物反差和影像反差两种。前者指景物中最大亮度与最小亮度之比或对数差;后者是影像中最大密度与最小密度之差。两者间密切相关。一幅优良的遥感影像,其影像反差应能正确反映被摄景物的原有反差。这个关系用反差系数来表征。当反差系数为1时,表明影像反差等于景物反差;反差系数<1时,影像反差小于景物反差;反差系数>1时,影像反差大于景物反差。影像反差是反映遥感影像质量的重要指标,具有良好影像反差的遥感影像,有利于影像的分析、判读。影响影像反差的因素很多,如景物本身反差、遥感器光学系统质量、大气濛雾、感光材料特性、曝光量和摄影处理等。故在遥感影像处理中,不论光化学处理或数字图像处理,均可采用反差增强或反差扩展技术,用提高影像反差来改善影像判读质量。方差:样本中各数据与样本平均数的差的平方和的平均数叫做样本方差;样本方差的算术平方根叫做样本标准差。样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越大,样本数据的波动就越大。数学上一般用E{[X-E(X)]^2}来度量随机变量X与其均值E(X)即期望的偏离程度,称为X的方差。
‘肆’ 各种遥感数据分类方法比较
常用的遥感数据的专题分类方法有多种,从分类判别决策方法的角度可以分为统计分类器、神经网络分类器、专家系统分类器等;从是否需要训练数据方面,又可以分为监督分类器和非监督分类器。
一、统计分类方法
统计分类方法分为非监督分类方法和监督分类方法。非监督分类方法不需要通过选取已知类别的像元进行分类器训练,而监督分类方法则需要选取一定数量的已知类别的像元对分类器进行训练,以估计分类器中的参数。非监督分类方法不需要任何先验知识,也不会因训练样本选取而引入认为误差,但非监督分类得到的自然类别常常和研究感兴趣的类别不匹配。相应地,监督分类一般需要预先定义分类类别,训练数据的选取可能会缺少代表性,但也可能在训练过程中发现严重的分类错误。
1.非监督分类器
非监督分类方法一般为聚类算法。最常用的聚类非监督分类方法是 K-均值(K-Means Algorithm)聚类方法(Duda and Hart,1973)和迭代自组织数据分析算法(ISODATA)。其算法描述可见于一般的统计模式识别文献中。
一般通过简单的聚类方法得到的分类结果精度较低,因此很少单独使用聚类方法进行遥感数据专题分类。但是,通过对遥感数据进行聚类分析,可以初步了解各类别的分布,获取最大似然监督分类中各类别的先验概率。聚类分析最终的类别的均值矢量和协方差矩阵可以用于最大似然分类过程(Schowengerdt,1997)。
2.监督分类器
监督分类器是遥感数据专题分类中最常用的一种分类器。和非监督分类器相比,监督分类器需要选取一定数量的训练数据对分类器进行训练,估计分类器中的关键参数,然后用训练后的分类器将像元划分到各类别。监督分类过程一般包括定义分类类别、选择训练数据、训练分类器和最终像元分类四个步骤(Richards,1997)。每一步都对最终分类的不确定性有显着影响。
监督分类器又分为参数分类器和非参数分类器两种。参数分类器要求待分类数据满足一定的概率分布,而非参数分类器对数据的概率分布没有要求。
遥感数据分类中常用的分类器有最大似然分类器、最小距离分类器、马氏距离分类器、K-最近邻分类器(K-Nearest neighborhood classifier,K-NN)以及平行六面体分类器(parallelepiped classifier)。最大似然、最小距离和马氏距离分类器在第三章已经详细介绍。这里简要介绍 K-NN 分类器和平行六面体分类器。
K-NN分类器是一种非参数分类器。该分类器的决策规则是:将像元划分到在特征空间中与其特征矢量最近的训练数据特征矢量所代表的类别(Schowengerdt,1997)。当分类器中 K=1时,称为1-NN分类器,这时以离待分类像元最近的训练数据的类别作为该像元的类别;当 K >1 时,以待分类像元的 K 个最近的训练数据中像元数量最多的类别作为该像元的类别,也可以计算待分类像元与其 K 个近邻像元特征矢量的欧氏距离的倒数作为权重,以权重值最大的训练数据的类别作为待分类像元的类别。Hardin,(1994)对 K-NN分类器进行了深入的讨论。
平行六面体分类方法是一个简单的非参数分类算法。该方法通过计算训练数据各波段直方图的上限和下限确定各类别像元亮度值的范围。对每一类别来说,其每个波段的上下限一起就形成了一个多维的盒子(box)或平行六面体(parallelepiped)。因此 M 个类别就有M 个平行六面体。当待分类像元的亮度值落在某一类别的平行六面体内时,该像元就被划分为该平行六面体代表的类别。平行六面体分类器可以用图5-1中两波段的遥感数据分类问题来表示。图中的椭圆表示从训练数据估计的各类别亮度值分布,矩形表示各类别的亮度值范围。像元的亮度落在哪个类别的亮度范围内,就被划分为哪个类别。
图5-1 平行六面体分类方法示意图
3.统计分类器的评价
各种统计分类器在遥感数据分类中的表现各不相同,这既与分类算法有关,又与数据的统计分布特征、训练样本的选取等因素有关。
非监督聚类算法对分类数据的统计特征没有要求,但由于非监督分类方法没有考虑任何先验知识,一般分类精度比较低。更多情况下,聚类分析被作为非监督分类前的一个探索性分析,用于了解分类数据中各类别的分布和统计特征,为监督分类中类别定义、训练数据的选取以及最终的分类过程提供先验知识。在实际应用中,一般用监督分类方法进行遥感数据分类。
最大似然分类方法是遥感数据分类中最常用的分类方法。最大似然分类属于参数分类方法。在有足够多的训练样本、一定的类别先验概率分布的知识,且数据接近正态分布的条件下,最大似然分类被认为是分类精度最高的分类方法。但是当训练数据较少时,均值和协方差参数估计的偏差会严重影响分类精度。Swain and Davis(1978)认为,在N维光谱空间的最大似然分类中,每一类别的训练数据样本至少应该达到10×N个,在可能的条件下,最好能达到100×N以上。而且,在许多情况下,遥感数据的统计分布不满足正态分布的假设,也难以确定各类别的先验概率。
最小距离分类器可以认为是在不考虑协方差矩阵时的最大似然分类方法。当训练样本较少时,对均值的估计精度一般要高于对协方差矩阵的估计。因此,在有限的训练样本条件下,可以只估计训练样本的均值而不计算协方差矩阵。这样最大似然算法就退化为最小距离算法。由于没有考虑数据的协方差,类别的概率分布是对称的,而且各类别的光谱特征分布的方差被认为是相等的。很显然,当有足够训练样本保证协方差矩阵的精确估计时,最大似然分类结果精度要高于最小距离精度。然而,在训练数据较少时,最小距离分类精度可能比最大似然分类精度高(Richards,1993)。而且最小距离算法对数据概率分布特征没有要求。
马氏距离分类器可以认为是在各类别的协方差矩阵相等时的最大似然分类。由于假定各类别的协方差矩阵相等,和最大似然方法相比,它丢失了各类别之间协方差矩阵的差异的信息,但和最小距离法相比较,它通过协方差矩阵保持了一定的方向灵敏性(Richards,1993)。因此,马氏距离分类器可以认为是介于最大似然和最小距离分类器之间的一种分类器。与最大似然分类一样,马氏距离分类器要求数据服从正态分布。
K-NN分类器的一个主要问题是需要很大的训练数据集以保证分类算法收敛(Devijver and Kittler,1982)。K-NN分类器的另一个问题是,训练样本选取的误差对分类结果有很大的影响(Cortijo and Blanca,1997)。同时,K-NN分类器的计算复杂性随着最近邻范围的扩大而增加。但由于 K-NN分类器考虑了像元邻域上的空间关系,和其他光谱分类器相比,分类结果中“椒盐现象”较少。
平行六面体分类方法的优点在于简单,运算速度快,且不依赖于任何概率分布要求。它的缺陷在于:首先,落在所有类别亮度值范围之外的像元只能被分类为未知类别;其次,落在各类别亮度范围重叠区域内的像元难以区分其类别(如图5-1所示)。
各种统计分类方法的特点可以总结为表5-1。
二、神经网络分类器
神经网络用于遥感数据分类的最大优势在于它平等地对待多源输入数据的能力,即使这些输入数据具有完全不同的统计分布,但是由于神经网络内部各层大量的神经元之间连接的权重是不透明的,因此用户难以控制(Austin,Harding and Kanellopoulos et al.,1997)。
神经网络遥感数据分类被认为是遥感数据分类的热点研究领域之一(Wilkinson,1996;Kimes,1998)。神经网络分类器也可分为监督分类器和非监督分类器两种。由于神经网络分类器对分类数据的统计分布没有任何要求,因此神经网络分类器属于非参数分类器。
遥感数据分类中最常用的神经网络是多层感知器模型(multi-layer percep-tron,MLP)。该模型的网络结构如图5-2所示。该网络包括三层:输入层、隐层和输出层。输入层主要作为输入数据和神经网络输入界面,其本身没有处理功能;隐层和输出层的处理能力包含在各个结点中。输入的结构一般为待分类数据的特征矢量,一般情况下,为训练像元的多光谱矢量,每个结点代表一个光谱波段。当然,输入结点也可以为像元的空间上下文信息(如纹理)等,或多时段的光谱矢量(Paola and Schowengerdt,1995)。
表5-1 各种统计分类器比较
图5-2 多层感知器神经网络结构
对于隐层和输出层的结点来说,其处理过程是一个激励函数(activation function)。假设激励函数为f(S),对隐层结点来说,有:
遥感信息的不确定性研究
其中,pi为隐层结点的输入;hj为隐层结点的输出;w为联接各层神经之间的权重。
对输出层来说,有如下关系:
遥感信息的不确定性研究
其中,hj为输出层的输入;ok为输出层的输出。
激励函数一般表达为:
遥感信息的不确定性研究
确定了网络结构后,就要对网络进行训练,使网络具有根据新的输入数据预测输出结果的能力。最常用的是后向传播训练算法(Back-Propagation)。这一算法将训练数据从输入层进入网络,随机产生各结点连接权重,按式(5-1)(5-2)和(5-3)中的公式进行计算,将网络输出与预期的结果(训练数据的类别)相比较并计算误差。这个误差被后向传播的网络并用于调整结点间的连接权重。调整连接权重的方法一般为delta规则(Rumelhart,et al.,1986):
遥感信息的不确定性研究
其中,η为学习率(learning rate);δk为误差变化率;α为动量参数。
将这样的数据的前向和误差后向传播过程不断迭代,直到网络误差减小到预设的水平,网络训练结束。这时就可以将待分类数据输入神经网络进行分类。
除了多层感知器神经网络模型,其他结构的网络模型也被用于遥感数据分类。例如,Kohonen自组织网络被广泛用于遥感数据的非监督聚类分析(Yoshida et al.,1994;Schaale et al.,1995);自适应共振理论(Adaptive Resonance Theory)网络(Silva,S and Caetano,M.1997)、模糊ART图(Fuzzy ART Maps)(Fischer,M.M and Gopal,S,1997)、径向基函数(骆剑承,1999)等也被用于遥感数据分类。
许多因素影响神经网络的遥感数据分类精度。Foody and Arora(1997)认为神经网络结构、遥感数据的维数以及训练数据的大小是影响神经网络分类的重要因素。
神经网络结构,特别是网络的层数和各层神经元的数量是神经网络设计最关键的问题。网络结构不但影响分类精度,而且对网络训练时间有直接影响(Kavzoglu and Mather,1999)。对用于遥感数据分类的神经网络来说,由于输入层和输出层的神经元数目分别由遥感数据的特征维数和总的类别数决定的,因此网络结构的设计主要解决隐层的数目和隐层的神经元数目。一般过于复杂的网络结构在刻画训练数据方面较好,但分类精度较低,即“过度拟合”现象(over-fit)。而过于简单的网络结构由于不能很好的学习训练数据中的模式,因此分类精度低。
网络结构一般是通过实验的方法来确定。Hirose等(1991)提出了一种方法。该方法从一个小的网络结构开始训练,每次网络训练陷入局部最优时,增加一个隐层神经元,然后再训练,如此反复,直到网络训练收敛。这种方法可能导致网络结构过于复杂。一种解决办法是每当认为网络收敛时,减去最近一次加入的神经元,直到网络不再收敛,那么最后一次收敛的网络被认为是最优结构。这种方法的缺点是非常耗时。“剪枝法”(pruning)是另一种确定神经网络结构的方法。和Hirose等(1991)的方法不同,“剪枝法”从一个很大的网络结构开始,然后逐步去掉认为多余的神经元(Sietsma and Dow,1988)。从一个大的网络开始的优点是,网络学习速度快,对初始条件和学习参数不敏感。“剪枝”过程不断重复,直到网络不再收敛时,最后一次收敛的网络被认为最优(Castellano,Fanelli and Pelillo,1997)。
神经网络训练需要训练数据样本的多少随不同的网络结构、类别的多少等因素变化。但是,基本要求是训练数据能够充分描述代表性的类别。Foody等(1995)认为训练数据的大小对遥感分类精度有显着影响,但和统计分类器相比,神经网络的训练数据可以比较少。
分类变量的数据维对分类精度的影响是遥感数据分类中的普遍问题。许多研究表明,一般类别之间的可分性和最终的分类精度会随着数据维数的增大而增高,达到某一点后,分类精度会随数据维的继续增大而降低(Shahshahani and Landgrebe,1994)。这就是有名的Hughes 现象。一般需要通过特征选择去掉信息相关性高的波段或通过主成分分析方法去掉冗余信息。分类数据的维数对神经网络分类的精度同样有明显影响(Battiti,1994),但Hughes 现象没有传统统计分类器中严重(Foody and Arora,1997)。
Kanellopoulos(1997)通过长期的实践认为一个有效的ANN模型应考虑以下几点:合适的神经网络结构、优化学习算法、输入数据的预处理、避免振荡、采用混合分类方法。其中混合模型包括多种ANN模型的混合、ANN与传统分类器的混合、ANN与知识处理器的混合等。
三、其他分类器
除了上述统计分类器和神经网络分类器,还有多种分类器被用于遥感图像分类。例如模糊分类器,它是针对地面类别变化连续而没有明显边界情况下的一种分类器。它通过模糊推理机制确定像元属于每一个类别的模糊隶属度。一般的模糊分类器有模糊C均值聚类法、监督模糊分类方法(Wang,1990)、混合像元模型(Foody and Cox,1994;Settle and Drake,1993)以及各种人工神经网络方法等(Kanellopoulos et al.,1992;Paola and Schowengerdt,1995)。由于模糊分类的结果是像元属于每个类别的模糊隶属度,因此也称其为“软分类器”,而将传统的分类方法称为“硬分类器”。
另一类是上下文分类器(contextual classifier),它是一种综合考虑图像光谱和空间特征的分类器。一般的光谱分类器只是考虑像元的光谱特征。但是,在遥感图像中,相邻的像元之间一般具有空间自相关性。空间自相关程度强的像元一般更可能属于同一个类别。同时考虑像元的光谱特征和空间特征可以提高图像分类精度,并可以减少分类结果中的“椒盐现象”。当类别之间的光谱空间具有重叠时,这种现象会更明显(Cortijo et al.,1995)。这种“椒盐现象”可以通过分类的后处理滤波消除,也可以通过在分类过程中加入代表像元邻域关系的信息解决。
在分类过程中可以通过不同方式加入上下文信息。一是在分类特征中加入图像纹理信息;另一种是图像分割技术,包括区域增长/合并常用算法(Ketting and Landgrebe,1976)、边缘检测方法、马尔可夫随机场方法。Rignot and Chellappa(1992)用马尔可夫随机场方法进行SAR图像分类,取得了很好的效果,Paul Smits(1997)提出了保持边缘细节的马尔可夫随机场方法,并用于SAR图像的分类;Crawford(1998)将层次分类方法和马尔可夫随机场方法结合进行SAR图像分类,得到了更高的精度;Cortijo(1997)用非参数光谱分类对遥感图像分类,然后用ICM算法对初始分类进行上下文校正。
‘伍’ 遥感中几种影像分类方法有什么不同
没什么不同。最主要的差别在精度。对于你的研究区域,可以多种方法尝试一下,然后看看分类精度,最后判断哪一种方法更适合你。
监督分类是利用训练样本对各类别进行规定,在基于已规定的类别进行分类。分类时有许多的算法,最大似然法是其中的一种。应用上真没什么特别的讲究,就是精度主导一切。
‘陆’ 实验十七 遥感图像监督分类处理
一、实验目的
通过使用ENVI的六种主要的遥感监督分类器——平行六面体分类、最小距离分类、马氏距离分类、最大似然分类、神经网络分类和支持向量机分类的命令,加深对遥感监督分类原理的理解,了解其技术实现过程,初步掌握其ENVI功能命令的基本使用操作。
二、实验内容
①桂林市TM 遥感影像平行六面体分类;②桂林市TM 遥感影像最小距离分类;③桂林市TM 遥感影像马氏距离分类;④桂林市TM 遥感影像最大似然分类;⑤桂林市TM 遥感影像神经网络分类;⑥桂林市TM 遥感影像支持向量机分类;⑦对6种分类结果进行比较分析。
三、实验要求
①平行六面体、最小距离、马氏距离、最大似然、神经网络和支持向量机六种分类方法在理论上比较复杂,为取得好的实验效果,要求实验前事先预习其原理,从理论上理解并掌握它们的特点和异同。②确定分类处理方法训练样本需要用到的已知地质资料,提前准备。③编写实验报告。④由于同时做六种分类处理工作量较大,可以根据实际课时情况选择做其中部分。最小距离分类为必须做的方法。
四、技术条件
①微型计算机;②灌阳地区QuickBird全色波段遥感数据;③ENVI软件;④Photoshop软件(ver.6.0以上)和ACDSee软件(ver.4.0以上)。
五、实验步骤
遥感影像监督分类可以分为四个过程:样本选择、执行监督分类、评价分类结果和分类后处理。具体操作步骤如下。
(一)定义训练
1.样本选择
(1)在ENVI主菜单中,选择“File>Open Image File”,打开灌阳地区QuickBird全色波段遥感数据,Band3、4、1合成RGB并使之显示在“Display”中,通过分析图像,选择耕地、林地、居民地和水体四种地物样本。
图17-1 ROI工具对话框
(2)在主图像窗口中,选择“Overlay>Region of Interest”,打开“ROI Tool”对话框,如图17-1所示。
(3)在“ROI Tool”对话框中,选择“Window”选项,可以在“Image”、“Scroll”或者“Zoom”窗口中绘制感兴趣区;在“ROI Name”字段输入样本的名称;在“Color”字段中,单击右键选择颜色。
(4)在“ROI Tool”对话框中,选择“ROI Type > Polygon”,在“Image”、“Scroll”或者“Zoom”窗口中绘制感兴趣区。
(5)完成一类感兴趣区的绘制后,在“ROI Tool”对话框中,选择【New Region】按钮,新建另一类样本种类,重复上述操作。
2.评价训练样本
在ROI对话框中,选择“Option>Compute ROI Separability”,打开待分类影像文件,选择所有定义的样本类型,可以计算样本的可分离性,如图17-2所示,表示各个样本类型之间的可分离性,用Jeffries-Matusita距离和转换分离度(Transformed Divergence)来表示。ENVI为每一个感兴趣区组合计算Jeffries-Matusita距离和Transformed Divergence,在对话框底部,根据可分离性值的大小,从小到大列出感兴趣区组合。这两个参数的值在0~2.0之间,大于1.9说明样本之间可分离性好,属于合格样本;小于1.8,需要重新选择样本;小于1,考虑将两类样本合成一类样本。
图17-2 样本可分离性计算报表
(二)执行监督分类
在ENVI主菜单中选择“Classificatoin>Supervisred>分类器类型”,可以根据分类的复杂度、精度需求等选择分类器。
1.平行六面体分类器
平行六面体用一条简单的判定规则对多波谱数据进行分类。判定边界在图像数据空间中形成了一个N维平行六面体。平行六面体的维数由来自每一种选择的分类平均值的标准差的阈值确定。如果像元值位于N 个被分类波段的低阈值与高阈值之间,则它归属于这一类。如果像元值落在多个类里,那么ENVI将这一像元归到最后一个匹配的类里。没有落在平行六面体的任何一类里的区域被称为无类别的。操作步骤如下:
(1)在ENVl主菜单栏中选择“Classification>Supervised>Parallelepiped”,在分类输入文件对话框中选择待分类遥感影像,打开“Parallelepiped Parameters”对话框,如图17-3所示。
图17-3 平行六面体分类器参数设置对话框
(2) Select Classes from Regions:点击【Select All Items】按钮,选择所有的训练样本。
(3) Set Max stdev from Mean:设置标准差阈值。有三种类型:不设置标准差阈值(None)、为所有类别设置一个标准差阈值(Single Value)和分别为每种类别设置一个标准差阈值(Multiple Values)。
(4)选择“Single Value”,在“Max stdev from Mean”文本框里输入标准差阈值。
(5)点击【Preview】按钮,可以预览分类结果。
(6)选择分类结果的输出路径及文件名。
(7)设置“Output Rule Images”:是否选择规则图像数据。
(8)设置完上述参数后,点击【OK】按钮执行分类处理。
2.最小距离分类器
最小距离分类用到每一个终端单元的均值矢量,计算每一个未知像元到每一类均值矢量的欧几里德距离。所有像元都被归为最近的一类,除非限定了标准差和距离的极限(这时,会出现一些像元因不满足选择的标准,而成为“无类别”),操作步骤如下:
(1)在ENVI主菜单栏中选择“Classification>Supervised>Minimum Distance”,在分类输入文件对话框中选择待分类遥感影像,打开“Minimum Distance”对话框,如图174所示。
图17-4 最小距离分类器参数设置对话框
(2) Select classes from Regions:点击【Select All Items】按钮,选择所有的训练样本。
(3) Set Max stdev from Mean:设置标准差阈值。有3种类型:不设置标准差阈值(None)、为所有类别设置一个标准差阈值(Single Value)和分别为每种类别设置一个标准差阈值(Multiple Values)。
(4)选择“Single Value”,在“Max stdev from Mean”文本框里输入标准差阈值。
(5) Set Max Distances Error:设置允许的最大距离误差,距离大于该值的像元将不被分入该类,如果不满足所有类别的最大距离误差,将会被归为未分类类型中,有3种类型:不设置最大距离误差(None)、为所有类别设置一个最大距离误差(Single Value)和分别为每种类别设置一个最大距离误差(Multiple Values)。
(6)点击【Preview】按钮,可以预览分类结果。
(7)选择分类结果的输出路径及文件名。
(8)设置“Output Rule Images”:是否选择规则图像数据。
(9)设置完上述参数后,点击【OK】按钮执行分类处理。
.3 马氏距离分类器
马氏距离分类是一个方向灵敏的距离分类器,分类时用到了统计。它与最大似然分类有些类似,但是假定所有类的协方差相等,所以是一种较快的方法。所有像元都被归到最临近的ROI类,除非用户限定了一个距离阈值(这时,如果一些像元不在阈值内,就会被划为无类别),操作步骤如下:
(1)在ENVI主菜单栏中选择“Classification>Supervised>Mahalanobis Distance”,在分类输入文件对话框中选择待分类遥感影像,打开“Mahalanobis Distance”对话框,如图17-5所示。
(2) Select Classes from Regions:点击【Select All Items】按钮,选择所有的训练样本。
图17-5 马氏距离分类器参数设置对话框
(3) Set Max Distances Error:设置允许的最大距离误差,距离大于该值的像元将不被分入该类,如果不满足所有类别的最大距离误差,将会被归为未分类类型中,有3种类型:不设置最大距离误差(None)、为所有类别设置一个最大距离误差(Single Value)和分别为每种类别设置一个最大距离误差(Multiple Values)。
(4)点击【Preview】按钮,可以预览分类结果。
(5)选择分类结果的输出路径及文件名。
(6)设置“Output Rule Images”:是否选择规则图像数据。
(7)设置完上述参数后,点击【OK】按钮执行分类处理。
4.最大似然分类器
最大似然分类假定每个波段每一类统计呈均匀分布,并计算给定像元属于一特定类别的可能性。除非选择一个可能性阈值,所有像元都将参与分类。每一个像元被归到可能性最大的那一类里。操作步骤如下:
(1)在ENVI主菜单栏中选择“Classification>Supervised>Maximum Likelihood”,在分类输入文件对话框中选择待分类遥感影像,打开“Maximum Likelihood Parameters”对话框,如图17-6所示。
(2) Select Classes from Regio:n点s击【Select All Items】按钮,选择所有的训练样本。
图17-6 最大似然分类器参数设置对话框
(3)Set Probability Threshold:设置似然度的阈值,有3种类型:不设置最大似然度阈值(None)、为所有类别设置一个最大似然度阈值(Single Value)和分别为每种类别设置一个最大似然度阈值(Multiple Values),如果选择Single Value,则在Probability Threshold文本框中输入一个0~1的值。
(4) Data Scale Factor:输入一个数据比例系数,这个比例系数是一个比值系数,用于将整形反射率或者辐射率数据转换为浮点型数据。例如,对于没有经过辐射定标的8bit数据,设定比例系数为255。
(5)点击【Preview】按钮可以预览分类结果。
(6)选择分类结果的输出路径及文件名。
(7)设置“Output Rule Images”:是否选择规则图像数据。
(8)设置完上述参数后,点击【OK】按钮执行分类处理。
5.神经网络分类器
用计算机模拟入脑的结构,用许多小的处理单元模拟生物的神经元,用算法实现人脑的识别、记忆、思考过程应用于图像分类,操作步骤如下:
(1)在ENVI主菜单栏中选择“Classificantion>Supervised>Neural Net”,在分类输入文件对话框中选择待分类遥感影像,打开“Neural Net Parameters”对话框,如图17-7所示。
(2)Select Classes from Regions:点击【Select All Items】按钮,选择所有的训练样本。
图17-7 神经网络分类器参数设置对话框
(3) Activation:选择活化函数,包括对数(Logistic)和双曲线(Hyperbolic)。
(4) Training Threshold Contnbution:输入训练贡献阈值(0~1)。该参数决定了与活化节点级别相关的内部权重的贡献量,它用于调节节点内部权重的变化。训练算法交互式地调整节点间的权重和节点阈值,从而使输出层和响应误差达到最小。将该参数设置为0将不会调整节点的内部权重。适当调整节点的内部权重可以生成一幅较好的分类图像,但是如果设置的权重过大,对分类结果会产生不良影响。
(5) Training Rate:设置权重调节速度(0~1)。参数值越大则使得训练速度越快,但也增加摆动或者使训练结果不收敛。
(6) Training Momentum:设置权重调节动量(0~1)。该值大于0时,在“Training Rate”文本框中输入较大值不会引起摆动。该值越大,训练的步幅越大。该参数的作用是促使权重沿当前方向改变。
(7)Training RMS Exit Criterai:指定RMS误差为何值时训练应该停止。RMS误差值在训练过程中将显示在图表中,当该值小于输入值时,即使还没有达到迭代次数,训练也会停止,然后开始进行分类。
(8) Number of Hidden Layers:输入所用隐藏层的数量。要进行线性分类,输入值为0;进行非线性分类,输入值应该大于或者等于1。
(9) Number of Training Iterations:输入用于训练的迭代次数。
(10) Min Output Activation Threshold:输入一个最小输出活化阈值。如果被分类像元的活化值小于该阈值,在输出的分类中该像元将被归入未分类中。
(11)选择分类结果的输出路径及文件名。
(12)设置“Output Rule Images”:是否选择规则图像数据。
(13)设置完上述参数后,点击【OK】按钮执行分类处理。
6.支持向量机分类器
支持向量机分类(SVM)是一种建立在统计学习理论基础上的机器学习方法。SVM可以自动寻找那些对分类有较大区分能力的支持向量,由此构造出分类器,可以将类与类之间的间隔最大化,因而有较好的推广性和较高的分类准确率,操作步骤如下:
(1)在ENVl主菜单栏中选择“Classification>Supervised>SupportVec tor Machine”,在分类输入文件对话框中选择待分类遥感影像,打开“Support Vector Machine Classification Parameters”对话框,如图17-8所示。
图17-8 支持向量机分类器参数设置对话框
(2) Select Classes From Regions:点击【Select All Items】按钮,选择所有的训练样本。
(3) Kemel Type下拉列表中的选项有:Linear、Polynomial、Radial Basis Function和Sigmoid。
若选择Polynomial,需要设置一个核心多项式(Degere of Kernel Polynomial)的次数用于SVM,最小值为1,最大值为6;使用向量机规则需要为Kernel指定“this Bias”,默认值为1;“Gamma in Kernel Function”参数设置为大于0的浮点型数据,默认值为输入图像波段数的倒数。
若选择“Radial Basis Function”,需设置“Gamma in Kernel Function”参数为大于0的浮点型数据,默认值为输入图像波段数的倒数。
若选择Sigmoid,需使用向量机规则需要为Kernel指定“this Bias”,默认值为1;设置“Gamma in Kernel Function”参数为大于0的浮点型数据,默认值为输入图像波段数的倒数。
(4) Penalty Parameter:为大于0的浮点型数据,这个参数控制了样本错误与分类刚性延伸之间的平衡,默认值为100。
(5)Pyramid Levels:设置分级处理等级,用于SVM训练和分类处理过程,如果这个值为0,将以原始分辨率处理,最大值随图像的大小改变。
(6) Pyramid Reclassification Threshold(0~1):当Pyramid Levels值大于0时,需要设置这个重分类阈值。
(7) Classification Probability Threshold(0~1):为分类设置概率阈值,如果一个像素计算得到所有的规则概率小于该值,该像素将不被分类。
(8)选择分类结果的输出路径及文件名。
(9)设置“Output Rule Images”:是否选择规则图像数据。
(10)设置完上述参数后,点击【OK】按钮执行分类处理。
(三)评价分类结果
在执行监督分类后,需要对分类结果进行评价,本次实验采用使用地表真实感兴趣区来计算混淆矩阵(Confusion Matrices)方法进行分类结果评价,操作步骤如下。
1.建立地表真实感兴趣区
可以在高分辨率图像上,通过目视解译获取各个分类的地表真实感兴趣区;也可以通过野外实地调查,根据调查数据生成地表真实感兴趣区,获取方法同“(一)定义训练”,为了同训练样本区别,我们使用“植被、城镇、河流、农田”作为地表真实感兴趣区名称。
2.计算混淆矩阵
(1)打开定义验证样本的文件(即灌阳地区QuickBird全色波段)以及图像分类结果,使之显示在“Available Band”列表中。
(2)在ENVI主菜单栏中选择“Basic>Region of Interest>Restore Saved ROI File”,打开地表真实感兴趣区文件。
(3)在ENVI主菜单栏中选择“Basic>Region of Interest>Restore ROIs via Map”,打开“Reconcile ROIs via Map”对话框(图179),选择相应的地表真实感兴趣区,点击【OK】按钮。
(4)在“Select Source File where ROI was Drawn”对话框中,选择定义验证样本的文件(即灌阳地区 QuickBird 全色波段),点击【OK】按钮。
(5)在“Select Destination File to Reconcile ROIs to”对话框中,选择匹配目标文件,也就是分类结果图像。
(6)在主菜单中选择“Classification>Post Classification> Confusion Matrix> Using Ground Truth ROIs”。
图17-9“Reconcile ROIs via Map”对话框
(7)在“Classification Input File”对话框中,选择分类结果图像。地表真实感兴趣区将被自动加载到“Match Classes Parameters”对话框中。
(8)在“Match Classes Parameters”对话框中,选择所要匹配的名称,然后点击【Add Combination】按钮,将地表真实感兴趣区与最终分类结果相匹配,类别之间的匹配将显示在对话框底部的列表中,如图17-10所示,点击【OK】按钮输出混淆矩阵。
图17-10“Match Classse Parameters”对话框
(9)在混淆矩阵输出窗口的“Confusion Matrix Parameters”对话框中,选择像素(Pixels)和百分比(Percent),如图17-11所示。
(10)点击【OK】按钮,输出混淆矩阵,在输出的混淆矩阵报表中,包含了总体分类精度、Kappa系数、混淆矩阵等几项评价指标。
图17-11 混淆矩阵输出对话框
(四)分类后处理
一般情况下,使用上述分类方法得到的结果难于达到最终应用的目的,所以对获取的分类结果需要进行一些处理,才能得到最终理想的分类结果。
图17-12 编辑分类名称和颜色
1.更改分类颜色、名称
(1)打开分类结果,并使之显示在“Display”窗口中。
(2)在分类结果主图像窗口中,选择“Tools>Color Mapping>Class Color Mapping”,打开“Class Color Mapping”对话框,如图17-12所示。
(3)从“Selected Classes”列表中选择需要修改的类别,改变其颜色或者名称。
(4)完成对需要修改类别的颜色、名称的修改后,选择“Options>Save Changes”保存修改内容。
(5)选择“File>Cancel”,关闭“Class Color Mapping”对话框。
2.聚类处理
分类结果中不可避免的会产生一些面积很小的图斑,从实际应用角度有必要对这些小图斑进行剔除或重新分类。目前,常用的方法有Majority/Minority分析、聚类处理和过滤处理,本次实验选择聚类处理方法对邻近的类似分类区聚类并合并。
聚类处理首先将被选的分类用一个扩大操作合并到一起,然后用参数对话框中指定了大小的变换核对分类图像进行侵蚀操作,具体操作步骤如下:
在ENVI主菜单栏中选择“Classification> Post Classification> Clump Classes”,在“Classification Input File”对话框中,选择分类结果图像,单击【OK】按钮,打开“Clump Parameters”对话框,如图17-13所示。Clump Parameters对话框参数设置如下。
(1)选择分类类别(Select Classes):单击【Select All Items】按钮选择所有类别;
(2)输入形态学算子大小(Rows和Cols):默认为3,3;
(3)选择输出路径及文件名,单击【OK】按钮,完成聚类处理。
3.分类统计
分类统计可以基于分类结果计算相关输入文件的统计信息,包括类别中的像元数、最大值、最小值、平均值以及类中每个波段的标准差等,还可以记录每类的直方图以及计算协方差矩阵、相关矩阵、特征值和特征向量,并显示所有分类的总结记录。
(1)在ENVI主菜单栏中,选择“Classification> Post Classification > Class Statistics”,在“Classification Input File”对话框中,选择分类结果图像,单击【OK】按钮。
(2)在“Statistics Input File”对话框中,选择一个用于计算统计信息的输入文件,点击【OK】按钮,打开“Class Selection”对话框(图17-14),在“Select Classes”列表中,选择想计算统计的类别名称,点击【OK】按钮,打开“Compute Statistics Parameters”对话框(图17-15),选择需要的统计项,包括以下统计类型。
图17-13 “Clump Parameters”对话框
图17-14 选择分类对话框
基本统计(Basic Stats):包括所有波段的最小值、最大值、均值和标准差,若该文件为多波段,还包括特征值。
直方图统计(Histograms):生成一个关于频率分布的统计直方图。
协方差统计(Covariance):包括协方差矩阵和相关矩阵以及特征值和特征向量。
(3)输出结果的方式包括3种:可以输出到屏幕显示、生成统计文件(.sta)和生成文本文件,其中生成的统计文件可以通过“Classification>Post Classification>View Statistics File”命令打开,选择输出路径及文件名,单击【OK】按钮,完成分类统计。
4.分类结果转矢量
(1)在ENVI主菜单栏中,选择“Classification>Post Classification>Classification to Vector”,在“Rasterto VectorInput Band”对话框中,选择分类结果图像,单击【OK】按钮,打开“Raster to Vector Parameters”对话框,如图17-16所示。
(2)选择需要被转换成矢量文件的类别,在“Output”标签中,使用箭头切换按钮选择“Single Layer”,把所有分类都输出到一个矢量层中;或者选择“One Layer per Class”,将每个所选分类输出到单独的矢量层。
(3)选择输出路径及文件名,单击【OK】按钮,完成分类结果转矢量文件。
图17-15 计算统计参数设置对话框
图17-16 栅格转为矢量参数设置
完成遥感影像监督分类后,分别利用平行六面体、最小距离、马氏距离、最大似然、神经网络和支持向量机这六种分类器对灌阳地区QuickBird遥感影像进行监督分类处理,利用混淆矩阵对六种分类结果进行评价,得出总体分类精度和Kappa系数。比较六种分类结果,用WORD文件记录,取名为《灌阳地区QuickBird遥感影像六种监督分类方法分类结果评价》,存入自己的工作文件夹。
六、实验报告
(1)简述实验过程。
(2)回答问题:①根据实验操作步骤及各步骤之间的关系,分析所做的监督分类方法在模型设计思想或算法上的共同特点。②通过目视解译,定性比较所获得的监督分类图像的图像识别效果优缺点。
实验报告格式见附录一。
‘柒’ 面向对象的遥感影像分类方法有哪些
面向对象分类技术它主要分成两部分过程:影像对象构建和对象的分类。影像对象构建主要用了影像分割技术,常用分割方法包括基于多尺度的、基于灰度的、纹理的、基于知识的及基于分水岭的等分割算法。比较常用的就是多尺度分割算法;影像对象的分类,目前常用的方法是“监督分类”和“基于知识分类”。
‘捌’ 遥感图像分类法
图像分类是与图像信息提取和增强不同的遥感图像处理中另一重要的方面,与图像增强后仍需人为解译不同,它企图用计算机做出定量的决定来代替人为视觉判译步骤。因此,分类处理后输出的是一幅专题图像。在此图像中,原来图像中的每一个象元依据不同的统计决定准则被划归为不同的地表覆盖类,由于是一种统计决定,必然伴随着某种错误的概率。因此,在逻辑上的合理要求是,对每一个象元所做的决定,应是使整个被分类面积即对大量单个象元的分类的某个错误判据为最小。
以下是几种常用的遥感图像分类方法:
1.最大似然分类(maximum likelihood classification)
最大似然分类是一种基于贝叶斯判别准则的非线性监督分类方法,需要知道已知的或确定的训练样区典型标准的先验概率P(wi)和条件概率密度函数P(wi,x)。P(wi)通常根据各种先验知识给出或假定它们相等:P(wix)则是首先确定其分布形式,然后利用训练样本估计其参数。一般假设为正态分布,或通过数学方法化为正态分布。其判别函数集为:
Di(x)=P(wix),i=1,2,…,m (2-2)
如果Di(x)≥ Dj(x),则x属于wi类。其中,j≠i,j=1,2,…,m。m为类别数。
从上述最大似然分类的说明看,其关键就在于已知类别的定义,先验概率的确定,参与分类的变量的好坏和结果误差评价。直到现在,最大似然分类至少还有两个缺点:一是事先大量人力已知光谱类的选择和定义:二是需要长时间的计算机分类计算时间。实际上这也使得最大似然分类法遥感应用受到了限制,因此许多人专门研究改进算法以便解决和缩减图像分类的时间,提高分类的精度。Solst和Lillesand(1991)为了解决已知类别定义消耗大量人力的缺点,发展了半自动训练法进行已知光谱类的定义。Fabio Maselli等(1992)利用Skidmore和Tumer提出的非参数分类器计算出各已知类训练集的先验概率,然后将它们插入常规的最大似然分类过程中进行分类。该方法融合了非参数和参数分类过程的优点,提高了分类的精度。
通常情况下,地形会影响到训练集数据,这样训练集光谱数据就偏离了最大似然分类的假设条件正态分布,从而常规的最大似然分类法在地形起伏较大的地区效果并不太好。为了解决这一问题,C.Conese和G.Maracchi和F.Maselli(1993)提出了一种改进的最大似然分类算法,即去掉每一类数据集中与第一主成分相关的信息(地形信息)然后再进行分类。通过试验,这种方法是有效的,分类精度得到了提高。
K.Arai(1993)用光谱和空间信息进行分类改进了最大似然分类方法。该方法简单易行,大大提高了正确分类的概率。C.Conese和Fabio Maselli(1992)用误差矩阵提高最大似然分类面积估计的精度。Irina Kerl(1996)加最大似然分类精度的一种方法,即多概率比较法。他对同一遥感数据的原始波段、主成分和植被指数的22种组合进行了最大似然分类,发现没有一种波段组合的分类能给出图像中所有土地利用类型的精确分类,每一波段组合仅对图像中的一两类土地利用类型分类有效。因此他提出将能有效区分出所要决定的土地利用类型的几个波段组合的分类结果进行组合来进行图像分类,并称这种方法为多概率比较法,这种方法的基础就是图像数据不同波段组合的分类结果之间分类概率大小的比较。应用这种方法提高了分类的精度。
2.最小距离分类(minimum distance classification)
最小距离分类是一种线性判别监督分类方法,也需要对训练区模式样本进行统计分析,是大似然分类法中的一种极为重要的特殊情况。最小距离分类在算法上比较简单,首先需选出要区分类别的训练样区,并且从图像数据中求出各类训练样区各个波段的均值和标准差,然后再计算图像中其他各个象元的灰度值向量到各已知类训练样区均值向量之间的距离。如果距离小于指定的阈值(一般取标准差的倍数),且与某一类的距离最近,就将该象元划归为某类。因此称为最小距离分类。该方法的精度主要取决于已知类训练样区的多少和样本区的统计精度。另外,距离度量的方法不同,分类的结果也不相同,常见的有:
(1)明氏距离(minkowski distance)
中亚地区高光谱遥感地物蚀变信息识别与提取
式中Tij=-Tij。
③经过①②步后,随机象元X被划归为正确的类。
另外,通过对参与计算变量的排序和部分一总和逻辑的考虑,可大大降低该算法计算的时间。与最小距离(欧氏距离)和最大似然分类器相比,整体平均分类器所用时间最少,分类精度与最小距离大致相同,对像农田面积和森林这样的名义类型的分类十分有效。
Haluk Cetin(1996)提出了一种分类方法:类间距离频率分布法(interclass distance frequency dis-tribution),这是多光谱数据非参数分类方法的一种。类间距离频率分布过程简单,是一种有力的可视化技术,它图形地显示多光谱数据和类分布。首先选择感兴趣的类,这些类的统计信息从典型的训练样区可获得。利用类的平均测量矢量计算多光谱数据中每个象元的距离,并存放在一个两维数据分布数组中。选择其他类的训练区,训练区数据的分布通过距离计算可获得。通过可视化地检查结果,建立分类查询表(look-up table),然后利用分类查询表进行多光谱图像数据的分类,具体细节请参见原文。
H.N.Srikanta Prakash等(1996)改进了遥感数据凝聚聚类分析,这是一种基于相互近邻概念,用来进行多光谱数据分类的非参数、层次、凝聚聚类分析算法。该方法定义了围绕象元的感兴趣区域(area of interest around each pixel),然后在它内部寻找分类时初始合并操作需要的k最近邻,将象元的特征值、波段值和象元的相对位置值一起考虑,提出了改进的距离量度,这样,大大减少了计算的时间和内存的需求,降低了分类的误差概率。
Steven E.Franklin和Bradley A.Wilson(1992)设计了3阶段分类器进行遥感图像的分类,它由一个基于四叉树的分割算子、一个高斯最小距离均值测试和一个包括辅助地理网数据和光谱曲线测量的最终测试构成。与最大似然分类技术相比,3阶段分类器的总体分类精度得到了提高,减少计算时间,另外仅需最少的训练样区数据(它们在复杂地形区很难获得)。
‘玖’ 实验十八 遥感图像非监督分类处理
一、实验目的
通过使用ENVI的两种遥感非监督分类器——IsoData非监督分类和K-Means非监督分类命令,加深对遥感非监督分类原理和对地质应用的理解,了解其技术实现过程,初步掌握其ENVI功能命令的基本使用操作。
二、实验内容
①桂林市TM 遥感影像数据IsoData非监督分类;②桂林市TM 遥感影像数据KMeans非监督分类;③IsoData非监督分类与K-Means非监督分类效果比较分析。
三、实验要求
(①预习ISODATA和K-Means两种算法原理;②掌握ISODATA和K-Means分类处理的基本操作;③对两种分类结果进行比较分析;④编写实验报告。
四、技术条件
①微型计算机;②桂林市TM 遥感影像数据;③ENVI软件;④Photoshop软件(ver.6.0以上)和ACDSee软件(ver.4.0以上)。
五、实验步骤
非监督分类是根据图像数据的本身统计特征及点群的情况,从纯统计学的角度对图像数据进行类别划分。非监督分类不需要事先给定类别,由图像数据的统计特征来决定,即同类地物在相同的成像条件下具有相同或相近的光谱特征(如DN 值),归属于同一个光谱空间区域;不同地物由于光谱信息特征不同,归属于不同的光谱空间区域。
非监督分类一般可分为四个步骤:执行非监督分类、类别定义、合并子类和评价结果。
(一)执行非监督分类
ENVI有ISODATA和K-Means两种非监督分类方法。
1.ISODATA非监督分类
ISODATA(iterative self-organizing data analysis technique)属于聚类分析方法。是按照像元之间的联系程度(亲疏程度)来进行归类的一种多元统计分析方法。ISODATA非监督分类计算数据空间中均匀分布的类均值,然后用最小距离技术将剩余像元迭代聚集,每次迭代都重新计算均值,且根据所得的新均值,对像元进行再分类。具体操作步骤如下:
在ENVI主菜单栏中选择“Classification>Unsupervised>ISODATA”,在“Classificatoin Input File”对话框中选择待分类遥感影像,打开“ISODATA Parameters”对话框,如图18-1所示。
图18-1 ISODATA参数对话框
对图18-1中的参数进行如下说明:
(1) Number of Classes:类数范围(最小值和最大值),一般输入最小数量不能小于最终分类数量,最大数量为最终分类数量的2~3倍。
(2) Maximum Iterations:最大迭代次数值,迭代次数越大,得到的结果越精确。
(3) Change Threshold%(0~100):变化阈值(0~100%),当每一类的变换像元数小于阈值时,结束迭代过程,该值越小得到的结果越精确。
(4) Minimum #Pixel in Class:形成一类需要的最少像元数,如果某一类中的像元数少于最少像元数,该类将被删除,其中的像元被归并到距离最近的类中。
(5) Maximum Class Stdv:最大分类标准差,以像素值为单位,如果某一类的标准差比该阈值大,该类将被拆分成两类。
(6) Minimum Class Distance:类均值之间的最小距离,如果类均值之间的距离小于输入的最小值,则这一类就会被合并。
(7) Maximum #Merge Pairs:合并成对的最大数。
(8)Maximum Stdev From Mean:距离类别均值的最大标准差,为可选项,筛选小于这个标准差的像元参与分类。
(9) Maximum Distance Error:允许的最大距离误差,为可选项,筛选小于这个最大距离误差的像元参与分类。
(10)选择输出路径及文件名,单击【OK】按钮,执行ISODATA非监督分类。
2.K-Means非监督分类
K-Means算法接受输入量K;然后将n个数据对象划分为K个聚类以便使所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”(引力中心)来进行计算的。具体操作步骤如下:
在ENVI主菜单栏中选择“Classification>Unsupervised>K-Means”,在“Classification Input File”对话框中选择待分类遥感影像,打开“K-Means Parameters”对话框,如图18-2所示。
图18-2 K-Means分类器参数设置对话框
(1) Number of Classes:分类数量,一般输入为最终分类数量的2~3倍。
(2) Maximum Iterations:最大迭代次数值,迭代次数越大,得到的结果越精确。
(3) Maximum Stdev From Mean:距离类别均值的最大标准差,为可选项,筛选小于这个标准差的像元参与分类。
(4) Maximum Distance Error:允许的最大距离误差,为可选项,筛选小于这个最大距离误差的像元参与分类。
(5)选择输出路径及文件名,单击【OK】按钮,执行K-Means非监督分类。
(二)定义类别与子类合并
执行非监督分类后,得到的只是一个初步的分类结果,需要进行类别定义域合并子类的操作。
1.类别定义
类别定义的根据可以通过更高分辨率图像上目视解译获得,也可以通过野外实地调查获得。
(1)打开分类图像即灌阳地区QuickBird遥感数据,并使之显示在“Display”中。
(2)在分类图像的主窗口中,选择“Overlay>Classification”,在“Interactive Class Tool Input File”对话框中选择非监督分类结果,单击【OK】按钮打开“Interactive Class Tool”对话框,如图18-3所示。
图18-3 交互式分类工具对话框
(3)在“Interactive Class Tool”对话框中,勾选类别前面的“On”选择框,就能将此类结果叠加显示在“Display”分类图像窗口上,识别此分类类别。
(4)在“Interactive Class Tool”对话框中,选择“Options>Edit Class Colors/Names”,打开“Class Color Map Editing”对话框,如图18-4所示。
在“Class Color Map Editnig”对话框中,选择对应的类别,在“Class Name”中输入重新定义的类别名称,同时可以修改此类别显示的颜色,修改后点击【OK】按钮完成修改。
(5)重复步骤(3)~步骤(4),定义其他类别。
(6)完成各类别定义后,在“Interactive Class Tool”对话框中,选择“File>Save Change to File”,保存修改结果。
2.合并子类
在选择非监督分类类别数量时,一般选择为最终分类数量的2~3倍,因此在定义类别之后,需要将相同类别合并。
(1)在 ENVI 主菜单栏中,选择“Classification > Post Classification > Combine Classes”,在“Combine Classes Input File”对话框中选择定义好的分类结果,单击【OK】按钮打开“Combine Classes Parameters”对话框(图18-5)。
图18-4 编辑分类名称和颜色对话框
图18-5 分类类别的合并对话框
(2)在“Combine Classes Parameters”对话框中,从“Select Input Class”中选择合并的类别,从“Select Output Class”中选择并入的类别,单击【Add Combination】按钮添加到合并方案中,合并方案显示在“Combine Classes”列表中。
(3)合并方案确定后,点击【OK】按钮,打开“Combine Classes output”对话框,在“Remove Empty Classes”选项中选择“Yes”,将无用类移除。
(4)选择输出合并结果路径及文件夹名,点击【OK】按钮,执行合并子类。
(三)分类后处理和评价分类结果
分类后处理和评价分类结果的方法同监督分类一样,可参考实验十七中的“遥感影像监督分类”。
完成遥感影像非监督分类后,分别利用ISODATA 和K-Means非监督分类方法对灌阳地区QuickBird遥感影像进行非监督分类处理,利用混淆矩阵对两种分类结果进行评价,得出总体分类精度和Kappa系数。比较两种分类结果,用W ORD文件记录,取名为《灌阳地区QuickBird遥感影像两种非监督分类方法分类结果评价》,存入自己的工作文件夹。
六、实验报告
(1)简述实验过程。
(2)回答问题:①根据实验操作步骤及各步骤之间的关系,分析两种非监督分类方法具有的共同特点。②通过目视解译定性比较两种非监督分类方法的效果。
实验报告格式见附录一。