手机知网 App
24小时专家级知识服务
打 开
手机知网|搜索

彩色图像的文本信息提取研究

叶茂锹

   随着计算机科学、多媒体技术的飞速发展,以彩色图像为主的多媒体信息迅速成为重要的通用信息媒体。在彩色图像中,文字信息(如新闻标题、旁白等等)包含了丰富的高层语义信息,自动提取出这些文字,通过对它们的识别和分析,对于图像高层语义的索引和检索是非常有帮助的。 传统的图像文本信息提取方法大多基于字符的代数和几何特征。本文研究比较了边缘、纹理、区域、角点检测等图像文本区域定位算法,分析了这些算法对彩色图像文本信息定位的效率。由于这些传统的方法存在的各种缺陷使之无法将类似字符的景物当作字符识别出来。因此,本文从另一个角度出发,将字符看成彩色图像的一部分,以颜色作为识别的特征,使类似字符的景物也可以被当作字符识别出来。 本文分析介绍了Mean—Shift算法的数学模型和物理模型并提出了基于Mean—Shift算法的图像文本信息提取方法。首先利用Mean—Shift算法对图像进行分割,得到分割出来的各颜色子图像。对这些子图像灰度化操作后就是目标文本区域,为了提取其中的有效文本特征,需要对文本区域再次进行阈值分割。本文对比介绍了全局、局部和动态三大阈值分割方法,并根据分割出来的子图像是单色图像的特点选择了全局阈值分割法进行阈值分割。 原始图像在经过Mean-Shift图像分割之后,要进行文本中的字符分割,本文采用投影字符分割方法。由于字符在行列间均存在空隙,字符间隙在投影中表现为波谷,此时可以在水平方向和垂直方向进行投影统计,寻找出波谷即可分割出字符,从而得到单个字符并将其分割出来。 在字符识别阶段,采用离散Hopfield神经网络方法将字符识别。该方法代码短小、执行快速,具有良好的识别效率。……   
[关键词]:文本信息提取;Mean-Shift图像分割;文本检测;离散Hopfield神经网络;字符识别
[文献类型]:硕士论文
[文献出处]:东华大学2009年