模式识别

来自中文百科,文化平台
跳转至: 导航搜索

模式识别英语:Pattern recognition),就是通过计算机数学技术方法来研究模式的自动处理和判读。我们把环境客体统称为“模式”。随着计算机技术的发展,人类有可能研究复杂的信息处理过程。信息处理过程的一个重要形式是生命体对环境及客体的识别。对人类来说,特别重要的是对光学信息(通过视觉器官来获得)和声学信息(通过听觉器官来获得)的识别。这是模式识别的两个重要方面。市场上可见到的代表性产品有光学字符识别语音识别系统。

计算机识别的显着特点是速度快、准确性高、效率高,在将来完全可以取代人工录入。

识别过程与人类的学习过程相似。以光学字符识别之“汉字识别”为例:首先将汉字图像进行处理,抽取主要表达特征并将特征与汉字的代码存在计算机中。就像老师教我们“这个字叫什么、如何写”记在大脑中。这一过程叫做“训练”。识别过程就是将输入的汉字图像经处理后与计算机中的所有字进行比较,找出最相近的字就是识别结果。这一过程叫做“匹配”。

模式识别与统计学心理学语言学计算机科学生物学控制论等都有关系。它与人工智能图像处理的研究有交叉关系。例如自适应或自组织的模式识别系统包含了人工智能的学习机制;人工智能研究的景物理解、自然语言理解也包含模式识别问题。又如模式识别中的预处理和特征抽取环节应用图像处理的技术;图像处理中的图像分析也应用模式识别的技术。

概述

模式识别是一种自动的信息处理技术,由称模式信号处理。其基本任务是构造某种自动机对客观事物进行自动分类或鉴别。英文“pattern”源于法文“patron”,本来是指可作为大家典范的理想的人,或用以模仿复制的完美的样品。

在模式识别学科中“模式”具有更广泛的意义。所谓模式,即客观事物存在的形式。具有相同属性的模式的集合称为模式类。不同事物间的差异,必然构成模式的差异,这种差异便成为鉴别事物的基础或依据。模式识别技术是对自然生命感知客观世界和认识客观世界的行为能力的一种模拟。幼儿所具有的鉴别家庭成员与非家庭成员的能力是一种模式识别。气象专家鉴别不同气象模式的能力也是一种模式识别。模式识别技术的目标就是用计算机或机器表现类似人类感知客观世界和认识客观世界的智能行为。模式识别的理论体系可分为统计模式识别和结构模式识别理论。统计模式识别又称决策理论方法,用特征向量描述模式,由模式集合的特征向量形成特征向量空间,依据一定的分类准则对特征向量空间进行划分,其模式识别的过程表现为划分模式特征向量空间的过程。结构模式识别又称句法模式识别,用符号串描述模式,选择一组能有效表达模式结构的基元(如同统计模式识别中的特征抽取),用文法规则描述基元之间的关系,其模式识别的过程表现为符号串文法分析的过程。

模式识别的研究主要在两方面:研究生物体(包括人)是如何感知对象的,属于认知科学的范畴;以及在给定任务下,如何用计算机实现模式识别的理论和方法。前者是生理学家、心理学家和神经生理学家的研究内容;后者通过数学家、信息学专家和计算机科学工作者近几十年的努力,已经取得了系统的研究成果。

模式识别系统构成及其信息流程

从统计模式识别的角度看,一个模式识别系统的信息流程可概略地用上图描述,系统的四个基本组成部分的功能为:①信息获取单元的任务是感知客观事物,提取模式信号。通过信息获取单元,作为客体的模式被转换成计算机或机器所能理解的形式。主要有数值,如山峰的高度、植物的年龄、航天运载工具的速度等;曲线,如心电图、语音信号、自动控制系统的响应曲线等;图像,如指纹图像、CT片、遥感图像等。②模式预处理单元的任务是对信息获取单元提取的模型信号进行初步的处理,如去除模式信号中的噪声,修复退化的模式信号、对模式信号进行范化处理等,即将模式信号映射至标准的模式空间。③模式特征抽取单元的任务是由预处理后的模式信号提取模式的本质属性。任何事物都有其本质的和非本质的属性,事物的鉴别取决于本质属性。因此,特征抽取是一个数据压缩或降维的过程,即剔除模式的非本质属性,突现其本质属性的过程。④在某种意义下,模式识别问题本质上是模式分类问题。分类器的任务是依据分类器中的分类准则,对模式特征向量进行分析和计算,以确定模式所属的范畴。分类器的设计是统计模式识别系统设计的重要环节,设计的基础是一组已知所属范畴的模式,即样本。分类准则的基本内涵就是基于一定的相似性测度判断待识别模式与样本的相似性。待识别模式倾向于划归相似度较大的样本所属的范畴。

计算机模式识别系统基本上由3部分组成,即数据采集、数据处理和分类决策或模型匹配。任何一种模式识别方法首先要通过各种传感器把研究对象的各种物理变量转换为计算机可以接受的数值或符号(串)集合。这种数值或符号(串)所组成的空间称为模式空间。为了从这些数值或符号(串)中提取对识别有效的信息,必须对它进行处理,包括消除噪声,排除不相干的信号,与对象的性质和采用的识别方法密切相关的特征的计算(如表征物体的形状、周长、面积等)及必要的变换(如为得到信号功率谱所进行的快速傅里叶变换)等。然后,通过特征选择和提取或基元选择形成模式的特征空间。模式分类或模型匹配就在特征空间的基础上进行。系统的输出是对象所属的类型或者是模型数据库中与对象最相似的模型编号。

结构模式识别系统的构成和信息流程与统计模式识别系统相似,只需用基元选择单元替换特征抽取单元,用文法分析单元替换分类器,用文法设计单元替换分类器设计单元。

应用领域

模式识别包括模式分析、聚类分析、文法分析、特征抽取、错误评估、判别式分析等。随着模糊集合论和神经计算学的发展,基于模糊逻辑的模糊聚类方法和基于神经网络联想记忆功能的模式识别系统研究,逐渐成为模式识别研究领域中重要的研究内容。模式识别技术应用于如指纹鉴定、语音识别、文本处理、疾病诊断、故障检测、图像理解、染色体识别、机器人视觉、雷达信号分析、遥感信号分析、气象模式的统计分析、工业生产过程的工况分析等领域。

参见