引言1.1 概述为了方便,我们居住的世界被普遍地贴上了标签,就是文字。文字一直是人类传递信息的重要手段。随着多媒体技术的发展以及对基于内容的多媒体检索的需求,从图像中提取文字成为数字图像处理的一个研究热点。将人类可以理解的信息,转化为二进制比特组成的机器语言,使计算机具有人类的感知,是我们的梦想。随着科技的进步,这个梦想也在逐步实现。
随着光学字符识别(OCR)技术的兴起,业界就开始进行文档图像中文字提取的研究。但是OCR技术只是针对二值化图像中的文字进行识别,不能应用到复杂背景下图像中的文字识别。66207
药盒图像分割就是复杂背景中文字分割的一个应用实例。复杂的背景很大程度上限制了文字分割效果。课题主要通过对药盒进行图像处理,实现药盒文字图像的定位和分割,进而可以在此基础上进行后续处理。如果将药盒图像的分割技术和文字识别技术相结合也可以对视力有障碍的人群提供方便。在今天这个信息飞速发展的时代,无论是让计算机对文字进行排版输出,还是要让计算机认识文字,所有这一切都是为了更好的服务与我们的生活。复杂背景下图像中的文字识别有着广泛的应用前景,可以用于图片检索,视频检索网络搜索,实时处理票据,身份证,护照,网络过滤等等。
基于上述原因,图像中文字信息的自动提取已经成为计算机视觉领域中一个重要的研究方向,近年来引起越来越多学者的关注。
1.2 图像分割技术的现状
应用领域的不同、图像质量的好坏及图像色彩的分布和结构的差别决定了很难找到一种通用的分割方法来解决由于这些客观因素所引起的图像分割问题。虽然国内外学者也都做了很多的研究,但是到目前为止还没有一种或者几种完美的算法可以完全按照人们的意愿得到完美的分割结果。所有现存分割方法只能针对某一类型的图像,分割的质量必须靠效果和实际的应用场景来判断。现阶段对于如何能够有效地把文字信息部分从复杂背景区域中精确完整地提取出来存在相当的困难。不过在人类研究图像的历史中,还是积累了许多经典的图像分割方法。虽然这些分割方法不适合所有类型的图像分割,但是这些方法却是图像分割方法进一步发展的基础。目前越来越多的学者开始将数学形态学、模糊理论、遗传算法理论、分形理论和小波变换理论等研究
成果运用到图像分割中产生了结合特定数学方法和针对特殊图像分割的先进图像分割技术。事实上,现代一些分割算法恰恰是从经典的分割方法衍生出来的。
图像分割主要基于以下三种经典算法:1)基于阈值;2)基于边缘;3)基于区域。近年来,研究人员不断改进原有的图像分割方法并把其它学科的一些新理论和新方法用于图像分割,提出了不少新的分割方法。论文网
1.3 论文的内容与安排
第1章概括图像分割技术的意义和研究现状;
第2章简述图像分割的含义、典型方法和药盒文字的特征;
第3章对三种典型分割方法的仿真实现和结果分析;
第4章药盒图像中文字分割算法的实现。
2 图像分割概述
2.1 图像分割的含义
图像分割就是把图像分成各具特性的区域并提取出感兴趣目标的技术和过程[1]。好的图像分割应具备以下特征:
1)分割出来的各区域对某种特性(如灰度和纹理)而言具有相似性,区域内部是连通的且没有过多小孔;
2)相邻区域对分割所依据的性质有明显的差异;