【模式识别】——1 绪论
- 1 模式和模式识别
-
- 举例
- 研究的对象的特性
- 如何完成一个模式识别任务
- 2 模式的分类
- 3 模式识别系统的基本构成
- 模式识别方法及其分类
1 模式和模式识别
概念 | 解释 |
---|---|
模式 | 把纯在于空间和时间的可观测事物的全体成为模式 |
模式类 | 把由彼此相似的模式构成的集合称为模式类 |
模式类别 | 把赋予每个模式类的标识符称为模式类别 |
理解:模式识别就是把存在的事物进行分类,这些存在的事物我们称为模式,结构相似的事物我们称作同一模式类。
模式识别(Pattern Recognition) 主要侧重于对人的认知行为进行模仿,把人的知识和经验转化为机器所利用的一些规则和方法,赋予机器对被观测事物进行综合分析和自动分类的能力。
使机器可以根据被观测事物过往的观测样本形成相应的分类规则(先学习),并据此完成对新的观测样本进行分类的任务(后工作)。
该学科的任务是研究相应的自动技术,依靠这种技术可以让机器自动地对输入模式(即观测样本)进行分类和识别以完成通常需要由人类来完成的分类和识别功能。
举例
假设有16张狗狗的照片,其中有柯基和哈士奇两种犬种,且每种狗狗有八张照片。
那么所有柯基的照片构成一个模式类,所有哈士奇的照片构成一个模式类。并且可以使用KJ、HSQ对柯基和哈士奇的所有照片形成的模式类进行冠名。
对于有经验的爱狗人士来说,区分它们很简单。但交给机器就显得十分复杂,在不考虑环境因素、摄像条件的情况下,需要对狗狗的体型、毛色、毛长、眼睛颜色等一些特征进行提取分析才能判断它属于哪一犬种。
研究的对象的特性
- 可观测性:即可由传感器装置获取或是采集。
- 可区分性:不同模式类的观测样本之间应该具有可区分的特征。
- 相似性:同一模式类的观测样本之间应该具有某种相似的特征。
如何完成一个模式识别任务
从观测样本中提取能够对所述模式做出区分的特征,这个过程称特征提取,然后利用这些特征,并根据以往的经验和知识完成对待识别模式的分类,这个过程称分类判决。
2 模式的分类
根据模式的来源进行分类,可分为三种:空间模式、时间模式和时空模式。
- 空间模式:如图片
- 时间模式:如语音
- 时空模式:如视频
3 模式识别系统的基本构成
主要由模式采集、预处理、特征提取和表达、识别与分类组成。
- 模式采集:一般由传感器、DAC组成。将现实世界中被测对象的具体表象(如灰度、彩色、压强和温度等)转换成对应的时间或空间分布信息,也可以再将其转化为电信号。
- 预处理:滤除在模式采集中可能引入的干扰和噪声,也可突出输入模式中有用的信息。预处理一般包括数字滤波、坐标变换、图像增强和图像恢复等操作。
- 特征选择和抽取:可分为度量或属性特征和基元特征。
- 度量或属性特征指形成待识别对象的有效描述的一组度量或属性参数(如长度、灰度、重量等属于度量特征;性别、文化程度等属于属性特征);
- 基元特征:指形成待识别对象的有效描述的基本子模式(边缘、纹理、轮廓和区域等)
- 特征表达:如果选择的特征是一组度量和属性特征,那么可用这些参量构建一个特征向量,所有特征向量组成一个特征空间。模式空间具有较大维数,而特征空间维数较小。从模式空间到特征空间的映射的实质是降维。
- 识别与分类:
- Step1:进行大量试验,在各种条件下对待识别对象进行大量的观测,获得待识别对象大量的观测样本.
- Step2:依据所选择的特征,通过特征抽取步骤将这些观测样本映射到相应的特征空间中。
- Step3:根据观测样本所对应的特征向量,在特征空间分布情况对特征空间实施分割,使得每个区域尽可能只包含来自同一个类别的样本。
- 通过以上操作可以在特征空间中的一个分割区域和一个类别之间建立关联。这样,以后采集到的每一个新样本,我们可以根据特在特征空间中的位置进行判决,即当这个样本属于某个区域时将其归入和相应区域存在关联的模式类别。
- 获得上述关联关系的过程称为训练,依据训练得到的结果对新的输入模式所作出的判决称为识别与分类。
模式识别方法及其分类
统计模式识别:根据观测样本在特征空间中分布情况,将特征空间划分为与类别数相等的若干个区域,每一个区域对应一个类别。
结构模式识别:当采用树或图等具有一定结构的表达方式时,相应的识别工作主要通过分析被测对象的结构信息完成。