一种基于支持向量机的车型自动分类器设计方案
发布时间:2007/4/23 0:00:00 访问次数:677
随着计算机硬件性能的不断提高,基于图像处理的车辆分类方法逐渐得到重视,计算机对摄像机捕捉到的车辆图像进行处理得到车辆的外形信息,这些信息可以作为车型识别依据进行车辆分类。已经采用的数据分析方法有模式匹配和BP神经网络两种。前者是将得到的外形信息与系统中的车型模式库进行比对,输出匹配度最大的模式类型作为车辆类型[1];后者是将车辆信息输入到已训练好的神经网络分类器进行分行[2]。基于模式匹配的分类方法实现原理简单,但是选择合适的模式比较困难;采用BP神经网络的分类方法中,由于BP神经网络本身存在网络结构无规律可循、作用机理不明确并易陷于局部极大小值等缺陷从而限制了这种方法的应用。
支持向量机是二十世纪90年代提出的一种新的学习机[3],具有较好的推广能力和非线性处理能力。本文给出一种基于支持向量机的车型分类器的设计方案。
1 支持向量机识别理论
设{xi}∈X∈жd为输入空间的某类别数据集,对于非线性可分情况而言,类别的边界比较复杂。引入从输入空间X到高维空间Y(特征空间)和非线性变换Φ将会简化类别边界。Φ可以把X中具有复杂几何形状的类边界(覆盖该类别全部数据集)映射为Y中的规则球(覆盖变换后的相应类别全部数据集)。如果希望输入空间X中类的边界紧致包围本类数据集,就要在变换后空间Y中寻找最小的闭合球。Y中的闭合球表述为:
|
其中||·||为欧式范数,a为球心。目标就是通过搜索所有满足约速条件的a来最小化R2。
构造Lagrange函数如下:
这里βh≤0,是Lagrange乘子。达到极小值的必要条件为:
把式(3)和式(4)代入式(2)消失r和a,就转化为它的Wolfe对偶问题:求式(5)中W关于变量βj的极大值。
在W达到极大值时,对于球内的数据和部分球上数据,βj=0;对于伴于球边界的数据,βj>0。满足βj>0的数据就是支持向量,它们定义了球的中心,如式(4)。
可以采用合适的Mercer核函数替代内积Φ(xi)·Φ(xj),目前主要的核函数有两种:
阶次为d的多项式核函数
其中C>0为常数。位于球内(包括球上)的数据点,有ζj=0和βj<C;对于反立数据点βj=C。
定义输入数据点x映射到特征空间内时到球心距离为:
根据式(4)以及核函数(7)的定义,可以得到:
类的半径定义为:
R={R(xi)|xj是支持向量} (14)
任选一支持向量代入式(13),即可求出R。
输入数据空间中该类的轮廓(分界面)就是集合
{x|R(x)=R} (15)
如果R(x)>R,那么x为孤立点或其它类点。
2 系统实现
2.1 图像采集和特征提取
利用两部CCD摄像机和图像采集卡获得同一车辆的两幡图像,基于双目视觉原理对两幅图像进行特征匹配,得到车辆的三维模型。根据摄像机标定矩阵和成像几何模型可以计算出车
随着计算机硬件性能的不断提高,基于图像处理的车辆分类方法逐渐得到重视,计算机对摄像机捕捉到的车辆图像进行处理得到车辆的外形信息,这些信息可以作为车型识别依据进行车辆分类。已经采用的数据分析方法有模式匹配和BP神经网络两种。前者是将得到的外形信息与系统中的车型模式库进行比对,输出匹配度最大的模式类型作为车辆类型[1];后者是将车辆信息输入到已训练好的神经网络分类器进行分行[2]。基于模式匹配的分类方法实现原理简单,但是选择合适的模式比较困难;采用BP神经网络的分类方法中,由于BP神经网络本身存在网络结构无规律可循、作用机理不明确并易陷于局部极大小值等缺陷从而限制了这种方法的应用。
支持向量机是二十世纪90年代提出的一种新的学习机[3],具有较好的推广能力和非线性处理能力。本文给出一种基于支持向量机的车型分类器的设计方案。
1 支持向量机识别理论
设{xi}∈X∈жd为输入空间的某类别数据集,对于非线性可分情况而言,类别的边界比较复杂。引入从输入空间X到高维空间Y(特征空间)和非线性变换Φ将会简化类别边界。Φ可以把X中具有复杂几何形状的类边界(覆盖该类别全部数据集)映射为Y中的规则球(覆盖变换后的相应类别全部数据集)。如果希望输入空间X中类的边界紧致包围本类数据集,就要在变换后空间Y中寻找最小的闭合球。Y中的闭合球表述为:
|
其中||·||为欧式范数,a为球心。目标就是通过搜索所有满足约速条件的a来最小化R2。
构造Lagrange函数如下:
这里βh≤0,是Lagrange乘子。达到极小值的必要条件为:
把式(3)和式(4)代入式(2)消失r和a,就转化为它的Wolfe对偶问题:求式(5)中W关于变量βj的极大值。
在W达到极大值时,对于球内的数据和部分球上数据,βj=0;对于伴于球边界的数据,βj>0。满足βj>0的数据就是支持向量,它们定义了球的中心,如式(4)。
可以采用合适的Mercer核函数替代内积Φ(xi)·Φ(xj),目前主要的核函数有两种:
阶次为d的多项式核函数
其中C>0为常数。位于球内(包括球上)的数据点,有ζj=0和βj<C;对于反立数据点βj=C。
定义输入数据点x映射到特征空间内时到球心距离为:
根据式(4)以及核函数(7)的定义,可以得到:
类的半径定义为:
R={R(xi)|xj是支持向量} (14)
任选一支持向量代入式(13),即可求出R。
输入数据空间中该类的轮廓(分界面)就是集合
{x|R(x)=R} (15)
如果R(x)>R,那么x为孤立点或其它类点。
2 系统实现
2.1 图像采集和特征提取
利用两部CCD摄像机和图像采集卡获得同一车辆的两幡图像,基于双目视觉原理对两幅图像进行特征匹配,得到车辆的三维模型。根据摄像机标定矩阵和成像几何模型可以计算出车