在国内外,起初都是由认知心理学家们着手开始显著性检测方面的研究。那时的显著性分析是由生物感知学科入手探讨研究的。之后,显著性检测有很多模型被不断建立起来,它们之间最大的不同主要是其测量原理的不同。大多数图像显著性模型[2][3][4]是基于人类视觉注意机制,同时结合心理学、神经生物学[5]等研究成果构建的算法完成。63968
1998年, Itti和Koch提出的视觉注意力模型[6](一种中心环绕操作作为局部特征对比作用于图像的颜色,强度和方向)是最早并且最具代表性的模型。Itti模型框架如图1.1所示,输入的原始图像通过一种被称之为中央-周边(Center-Surround)的算子将图像的颜色(color)、亮度(intensity)和方向(orientation)的局部特征对比计算出来,生成一系列的特征图,再把这些特征图归一化线性组合为显著图。
图1.1 Itti模型框架
不少方法都是Itti这个系列的,他们有着一个共同的特征,就是自底向上分析,把图像的低层基本特征(颜色、纹理、方向等)进行加工提取,对图像进行局部处理,再采取不同的方法策略归一化,进行融合与组合,才得到最终的显著图。这种显著性模型有一个很大的特点就是它们与图像的具体内容无关,只是取决于图像特征自身的反差,反差越大的区域显著性越明显。而另外一种自顶向下的视觉注意力模型则是利用高层语义特征(比如图形图像中的对象)来计算图像的显著性,虽然检测效果更加接近于人类的视觉系统,但是利用这种特征方法进行计算的模型的复杂度较高,成本比较大。目前也有些研究[8][9][10]结合自底向上和自顶向下这两种方法,取长补短,吸取两者精华,能够更加快捷地提取出来令人满意的显著区域。论文网
在图像显著性检测研究的过程中虽然有些方法可能是生物学上较为合理的,但是在计算机视觉上不是最佳的。Le Meur等人使用了一个清晰的计算方法为自底向上的视觉注意建构了模型。心理视觉空间用来结合视觉特性, 显著性通过对比敏感度功能被计算出来,而且通过交互信息的中央-周边假设判别式[7]计算显著性。在每个点的显著性值基本上可以被解释为某个或多个特征的局部对比度。这样的做法缺乏全局的测量,并且这些方法可能得不到令人满意的结果。Yan Junchi针对数据显著性检测提出一种简单的基于特征的矩阵计算模型。输入图像划分为多个块,这些图像块进一步通过词典进行分解。因此,图像可以通过词典分片表示。图像的特征数据可以被矩阵很自然的表示出来,每一行代表图像的某一个特征,每一列代表一个图像块。同时,矩阵可以被分解为两个矩阵的和:背景矩阵加上显著区域矩阵。由于视觉上的相似性和重复性,我们通常认为背景矩阵是低秩的,而显著区域一般而言比较小,所以我们通常也认为显著区域矩阵是稀疏的。该模型明显有了大大的创新点:首先,因为合理的图像信息描述,问题侧重于通过矩阵分解来求得显著元素。其次,求解目标显著性区域的问题可以很好地转换为一个计算可靠有效的最优化过程。与此类方法相关类似的文献可参考[11][12][13]。