手机知网 App
24小时专家级知识服务
打 开
计算机软件及计算机应用
基于SIFT的场景理解方法研究
场景理解建立在图像理解的基础上,也可以说图像理解就是通过处理图像数据来获得对图像所反映的场景的理解。场景理解是视觉分析的最高层次,是在对图像或图像系列的处理和分析基础上,进一步对图像的内容给予解释,或者说给出场景的含义。对于场景理解,人们已经建成了许多专用系统,但是还没有广泛意义上的通用系统。 本论文围绕场景理解的一些关键技术进行了一些探索性的研究,包括图像分割、特征提取、表示与描述以及图像匹配与识别。为了能够正确地理解图像的内容,首先要做的事情就是把图像中被识别的对象提取出来,然后利用知识和模型对其加以识别,从而获得图像的含义。图像分割就是把图像分成各具特性的区域并提取出感兴趣目标的技术。图像理解和解释必须是在对图像进行自动分析,提取特征的基础上实现的,有效的特征提取是图像理解中不可缺少的一环。 在完成对目标的分割、提取和描述之后,主要应解决的问题将是如何完成对图像的解释。通常在图像处理和理解的过程中我们可以采用特征来对目标加以描述。本论文的主要研究内容有:在重点研究了当前主流的几种特征检测子及描绘子之后,创新性地提出结合MSCR检测子与SIFT描述子进行场景识别的方法;采用数学形态学的方法对检测出的稳定区域进行消除与合并处理,更加有利于下一步的特征提取及描述,使检测更加稳定精确;把本文方法与采用其它检测子与描绘子的两种方法做了综合比较,结论得出本文方法具有较高的正确识别率;把本文方法与基于全局外观特征的方法做了比较,结论得出本文方法识别稳定性更高,能够更好的容忍尺度、视角等变化,具有较强的鲁棒性。 本文利用MSCR检测子检测最大稳定区域并计算所提取的稳定区域的SIFT特征,对其进行不变性表示。实际的场景识别过程如下所述:首先对已知场景用具有代表性的图像组建图像数据库;然后提取数据库中所有图像不变特征并存储。在识别阶段,将待识别图像严格按照上述方法进行处理。通过将待识别图像的特征与图像库中每一幅图像的特征做比较,并采用基于特征向量欧拉距离的方法识别该图像。 实验结果表明本文方法具有较高的正确识别率,并对图像非线性亮度变换、仿射变换以及3D视角变换都具有较强的鲁棒性。而且室内室外环境的场景识别实验也表明,该方法与基于全局外观的方法相比稳定性更高,性能更好。
硕士论文
《长春工业大学》 2010年硕士论文

搜 索