近邻法分类

来自中文百科,文化平台
跳转至: 导航搜索

近邻法分类英语:near neighbour classification),对被识别样本某个给定近邻域中的已知类别的学习样本数量进行统计,并以其中数量最多的那一类作为分类结果的分类方法。对k个被识别样本的近邻学习样本进行计算时,假设离被识别样本最近的5个学习样本中有3个属于某类,就把被识别样本判别为该类。当k等于1时,就是通常所说的最近邻规则,即被识别样本离哪一类的学习样本最近,就把它分到哪一类(见最小距离分类)。设R1,R2…,R0分别是已知类别的c个学习样本集合,每个集合Rj中有uj个特征向量,用x忋表示,k=1,2,…,uj。在用最近邻规则时,可以定义被识别特征向量y与Rj之间的距离为

近邻法分类.gif

式中‖·‖是给定的一种距离度量。分类器把被识别模式分类到d(y, Rj)值最小的那一类中去。当用欧氏距离作为距离度量时,可以证明这种方法实质上是一种分段线性分类器。理论分析表明,当学习样本无限增加时,用最近邻规则分类的结果,其误识率(错分率)不会超过贝叶斯分类器误识率的两倍。

参见