综述补充版.doc

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
综述补充版

稀疏编码综述 一、图像特征提取综述 1 引言 在数字图像处理中,图像最原始的表示是基于像素的矩阵形式。以灰度图像为例,它是对连续图像信号进行采样、量化得到的2维灰度矩阵。每个采样点对应一个像素,像素灰度值表示这一点的明暗程度,对于量化等级为0~255的8位灰度图像而言,0~255是一个由黑(0)到白(255)的灰度渐变过程(也可反过来)。如下图,显示了1幅灰度图像中的1个子区域的像素灰度矩阵。 至于彩色图像,可认为其每个像素处不是只有一个灰度值,而是颜色空间多个颜色通道灰度值的组合。如,RGB空间图像的每个像素包含红、绿、蓝(R、G、B)三种颜色分量,针对各颜色分量的多少,可划分为0~255共256个等级,0表示不含某种颜色分量,255表示含有100%的该颜色分量。这样,红、绿、蓝分量就能组合出256×256×256种颜色,例如某像素红、绿、蓝分量分别为255、0、255时显示为紫色。 特征提取可以是全局性的,即针对整幅图像进行处理和统计分析,最终用一个向量来描述图像,形成图像的全局表示(Holistic Representation),常用的颜色、形状、纹理特征就属于此类,如颜色直方图、轮廓矩、纹理能量等,这类特征常常被称为 全局特征(global feature);特征提取也可以是局部的,即针对图像中的特定子区域,这些子区域通常通过精心设计的检测算法获取[67],也可以简单地进行密集采样(Dense Sampling)或随机采样(Random Sampling)而得到[68],每个子区域均用一个相同维度的向量来描述,即局部特征(local features)。 图像局部特征及性质 图像局部特征是指图像中某个微小区域所表现出的区别于其邻域的信号模式。图像局部特征提取包含特征检测(Feature Detection)和特征描述(Feature Description)两个步骤。相应的算法习惯上称为检测算子(Detector,简称检测子)和描述算子(Descriptor,简称描述子)。 基于稀疏编码模型的图像稀疏表示方法 引言 从“信号重构”的角度对图像局部特征的编码,并在此基础上采用新的局部特征编码集成(融合)方法,形成图像的最终全局表示。这种“重构”是有条件的,即重构系数要满足“稀疏性”约束条件,即:用较少的系数捕获感兴趣目标的重要信息,最终用一个高维稀疏向量来表示图像。稀疏编码(SC)技术可以实现这一思想。 稀疏编码模型中的特征编码则是利用视觉词典中较少数量的视觉单词来重构局部特征向量,其数学意义是用稀疏线性组合的基向量(这里是视觉单词)来恢复原始信号(这里是局部特征向量),换句话说,原始信号可分解为少数基向量的线性组合。 稀疏编码的基本概念和关键技术 稀疏编码的概念最初来源于科学家们对视觉神经网络的研究。该研究表明,视觉皮层处理外界刺激的过程采用了 神经稀疏表示 的原则,即:视觉皮层在处理外界刺激时,只有相当少的一部分视觉神经元处于被激活的状态,而与此同时大量的视觉神经元处于未被激活的状态。 稀疏编码使得一个目标向量可以由少量的基向量来线性逼近,要实现信号(或图像)的稀疏表示,就要求基向量之间不仅具有完备性,而且还应具备一定程度的冗余性,形成所谓的“超完备基”,这可以通过使基向量个数远大于基向量维数(即在构造B时使Kd )来达到。 2.1 基本概念 B中的列向量成为原子,B称为字典(或词典),由于B的行数小于列数,B是超完备字典(词典),或称之为冗余字典(或词典)。 该方程组是欠定的,即方程个数少于未知数个数,通常解向量s 有无穷多个,构成了一个解空间。而稀疏编码的目标是要在该解空间汇总寻找一个最稀疏解,即:要使得系数向量s中的非零元素个数最少。 如果用 表示向量 中所含非零元素的个数(这里, 就是所谓的 L0-范数 ),上述稀疏表示问题的数学描述为如下优化问题: (1) 实际中,通常更多的是进行稀疏逼近,即允许稀疏表示有一定的重构误差,也就有如下的形势: (2) 稀疏编码一般分为两个过程:(1)词典构造。通过无监督学习方法学习得到一组冗余的基向量,构成超完备词典。该过程为“词典学习”(2)稀疏分解。将目标向量在词典所长成的空间分解,求得分解稀疏,在保证重构精度的前提下,尽量提高系数向量的稀疏性。 2.2 SC模型表示图像的关键技术 基本流程如下: 利用SC模型表示图像,获得图像的全局稀疏向量表示形式,基本步骤包括: 图像局部特征提取;利用局部特征提取算法,从图像中提取局部特征。 视觉词典学习。包括稀疏分解和词典更新两个过程。 局部特征稀疏编码。 局部特征编码集成(融合)。 基于稀疏编

您可能关注的文档

文档评论(0)

yaobanwd + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档