SIFT特征匹配算法介绍——寻找图像特征点的原理

SIFT特征匹配算法介绍——寻找图像特征点的原理关于opencv的SIFT特征匹配算法原理的详细介绍,附有图文解析,希望能帮助到图像处理刚入门的朋友们(*^__^*)嘻嘻……

大家好,又见面了,我是你们的朋友全栈君。

 1.图像尺度空间

在了解图像特征匹配前,需要清楚,两张照片之所以能匹配得上,是因为其特征点的相似度较高。

而寻找图像特征点,我们要先知道一个概念,就是图像尺度空间”。

平时生活中,用人眼去看一张照片时,随着观测距离的增加,图像会逐渐变得模糊。那么计算机在“看”一张照片时,会从不同的“尺度”去观测照片,尺度越大,图像越模糊。

那么这里的尺度”就是二维高斯函数当中的σ值,一张照片与二维高斯函数卷积后得到很多张不同σ值的高斯图像,这就好比你用人眼从不同距离去观测那张照片。所有不同尺度下的图像,构成单个原始图像的尺度空间图像尺度空间表达”就是图像在所有尺度下的描述。

尺度是自然客观存在的,不是主观创造的。高斯卷积只是表现尺度空间的一种形式。

 

2.“尺度空间表达”与“金字塔多分辨率表达”

尺度空间表达——高斯卷积

高斯核是唯一可以产生多尺度空间的核。在低通滤波中,高斯平滑滤波无论是时域还是频域都十分有效。我们都知道,高斯函数具有五个重要性质:

(1)二维高斯具有旋转对称性;

(2)高斯函数是单值函数

(3)高斯函数的傅立叶变换频谱是单瓣的

(4)高斯滤波器宽度(决定着平滑程度)是由参数σ表征的,而且σ和平滑程度的关系是非常简单的;

(5)二维高斯滤波的计算量随滤波模板宽度成线性增长而不是成平方增长

 

    一个图像的尺度空间L(x,y,σ) ,定义为原始图像I(x,y)与一个可变尺度的2维高斯函数G(x,y,σ)卷积运算。 

二维空间高斯函数表达式SIFT特征匹配算法介绍——寻找图像特征点的原理

     图像的尺度空间就是:二维高斯函数与原始图像卷积运算后的结果,

尺度空间的表达式:       SIFT特征匹配算法介绍——寻找图像特征点的原理

 

 SIFT特征匹配算法介绍——寻找图像特征点的原理SIFT特征匹配算法介绍——寻找图像特征点的原理

    左图是二维高斯函数在数学坐标系下的图像。

    右图是高斯函数对应的高斯核。

 

    高斯核是圆对称的,在图片像素中展现出来的是一个正方形,其大小由高斯模板确定。卷积的结果使原始像素值有最大的权重,距离中心越远的相邻像素值权重也越小。

SIFT特征匹配算法介绍——寻找图像特征点的原理

那么,为什么要提到高斯模糊与“尺度空间表达”,它们有什么关系呢?

“尺度空间表达”指的是不同高斯核所平滑后的图片的不同表达,意思就是:原始照片的分辨率,和经过不同高斯核平滑后的照片的分辨率是一样的。但是,对于计算机来说,不同模糊程度,照片“看”上去的样子就不一样了。高斯核越大,图片“看”上去就越模糊。

 

那么,图片的模糊与找特征点有关系吗?

计算机没有主观意识去识别哪里是特征点,它能做的,只是分辨出变化率最快的点。彩色图是三通道的,不好检测突变点。需要将RGB图转换为灰度图,此时灰度图为单通道,灰度值在0~255之间分布。

   无论人眼观测照片的距离有多远,只要能辨认出物体关键的轮廓特征,那就可以大致知道图像所表达的信息。计算机也一样,高斯卷积之后,图像虽然变模糊了。但是整体的像素没有变,依然可以找到灰度值突变的点。

    而这些点,就可以作为候选特征点了,后期再进一步减少点的数量,提高准确率即可。

 

金字塔多分辨率表达——降采样

这个比较好理解,若对一张图片进行降采样,其像素点就会减少,图片尺寸也会随之变小。那么给人的感觉就好比一个金字塔。

所谓图像金字塔化:就是先进行图像平滑,再进行降采样,根据降采样率不同,所得到一系列尺寸逐渐减小的图像。

SIFT特征匹配算法介绍——寻找图像特征点的原理

两种表达的不同之处在于:

    “尺度空间表达”在所有尺度上具有相同分辨率,而“图像金字塔化”在每层的表达上分辨率都会减少固定比率。

    “图像金字塔化”处理速度快,占用存储空间小,而“尺度空间表达”刚好相反。

 

3.LOGLaplassian of Gaussian

前面提出的那种表达,各有各的优势:

1)“尺度空间表达”在所有尺度上具有相同分辨率,而“图像金字塔化”在每层的表达上分辨率都会减少固定比率。

2)“图像金字塔化”处理速度快,占用存储空间小,而“尺度空间表达”刚好相反。

那么将两者融合起来的话,就得到了LOG图像,高斯拉普拉斯变换图像。其步骤是:先将照片降采样,得到了不同分辨率下的图像金字塔。再对每层图像进行高斯卷积。这样一来,原本的图像金字塔每层只有一张图像,而卷积后,每层又增加了多张不同模糊程度下的照片。

 SIFT特征匹配算法介绍——寻找图像特征点的原理SIFT特征匹配算法介绍——寻找图像特征点的原理

 

然而,LOG图像还不是我们想要的,我们做那么多就是为了更好地获取特征点,所以还需要对LOG图像再进一步地优化。所以,DOG图像横空出世!!

 

4.DOGDifference of Gaussian

DOG即高斯差分。

构造高斯差分图像的步骤是:在获得LOG图像后,用其相邻的图像进行相减,得到所有图像重新构造的金字塔就是DOG金字塔。

SIFT特征匹配算法介绍——寻找图像特征点的原理

(左图是LOG图像,右图是DOG图像)


 

5.DOG局部极值点

寻找极值点

当得到DOG金字塔后,我们接下来要做的是寻找DOG极值点。每个像素点与其周围的像素点比较,当其大于或者小于所有相邻点时,即为极值点。

比如说,如下图所示,以黄点为检测点,那么其周围的点,除了同层所包围的8个绿点外,还有上一层的9个点与下一层的9个点。

SIFT特征匹配算法介绍——寻找图像特征点的原理

极值点精确定位

而我们找的的极值点是在高斯差分之后所确定下来的,那么其是属于离散空间上的点,不一定是真正意义上的极值点。

我们需用用到一条曲线来进行拟合。

SIFT特征匹配算法介绍——寻找图像特征点的原理

 

离散转换为连续,我们会想到泰勒展开式:SIFT特征匹配算法介绍——寻找图像特征点的原理

则极值点为:   SIFT特征匹配算法介绍——寻找图像特征点的原理

去除边缘影响

到这一步,得到的极值点是比较精确了,但不够准确。有些极值点不是我们想要的,当中就有一大部分是边缘区域产生的极值点。因为物体的边缘轮廓在灰度图中,存在着灰度值的突变,这样的点在计算中就被“误以为”是特征值。

仔细分析,边缘区域在纵向上灰度值突变很大,但是横向上的变化就很小了。好比你用黑笔在白纸上水平画一条线段。垂直方向看,黑色线与白色区域的突变很大。但是水平方向看时,黑色线上某一点的水平临近点仍然是黑点,突变程度非常小。

    由于这一特殊性质,我们想到了Hessian矩阵,海塞矩阵是用来求曲率的,可以以函数的二阶偏导为元素,构成一个2×2的矩阵H:SIFT特征匹配算法介绍——寻找图像特征点的原理

    具体可参见Harris角点检测算法。

 

6.方向赋值

经过Harris角点检测算法之后,基本上得到了我们想要的精确特征点了。接下来我们就要求它们的方向。

DOG 金字塔中,有很多层高斯模糊后的图像。在此,我们对其中一张图像的处理进行说明。当我们精确定位关键点后,需要找到该特征点对应的尺度值σ,根据这一尺度值,将对应的高斯图像的关键点进行有限差分,以3×1.5σ为半径的区域内图像梯度的幅角幅值,得到:SIFT特征匹配算法介绍——寻找图像特征点的原理

然后利用直方图统计领域内像素对应的梯度和幅值:梯度方向角为横轴刻度,取45度为一个单位,那么横轴就有8个刻度;纵轴是对应梯度的幅值累加值。SIFT特征匹配算法介绍——寻找图像特征点的原理

取幅值最高的方向为主方向。有的时候,会出现第二峰值,因为有较多的关键点是多方向的。如果直接把它忽略掉不加以考虑的话,最后对匹配精度的影响还是蛮大的。

所以,为了匹配的稳定性,我们将超过峰值能量的百分之80的方向,称为辅方向。

 

7.关键点描述

确定描述子采样区域

到了这里,我们就已经得到赋值后的SIFT特征点了,其包含了位置,尺度,方向的信息。

接下来的要做的是:关键点的描述,即用一组向量将关键点描述出来。

SIFI 描述子h(x, y,θ)是对特征点附近邻域内高斯图像梯度统计结果的一种表示,它是一个三维的阵列,但通常将它表示成一个矢量。矢量是通过对三维阵列按一定规律进行排列得到的。特征描述子与特征点所在的尺度有关,因此,对梯度的求取应在特征点对应的高斯图像上进行。

 SIFT特征匹配算法介绍——寻找图像特征点的原理

 

生成描述子

为了保证特征矢量具有旋转不变性,需要以特征点为中心,将特征点附近邻域内(mσ(Bp+ 1)√2 x mσ(Bp+ 1)√2)图像梯度的位置和方向旋转一个方向角θ,即将原图像x轴转到与主方向相同的方向。

旋转公式如下:SIFT特征匹配算法介绍——寻找图像特征点的原理

 在特征点附近邻域图像梯度的位置和方向旋转后,再以特征点为中心,在旋转后的图像中取一个mσBp x mσBp大小的图像区域。并将它等间隔划分成Bp X Bp个子区域,每个间隔为像元。

 SIFT特征匹配算法介绍——寻找图像特征点的原理

到这里,有人会问:旋转过程中,中图和右图为什么每个像素点的方向不一样?其实,你要明确一点,你所选的小区域,是关键点旋转后的小区域,右图的区域跟旋转前的区域不一样了,右图是重新选取得区域,但是区域大小没变。

 

 

接下来就是生成特征匹配点。

在每子区域内计算8个方向的梯度方向直方图,绘制每个梯度方向的累加值,形成一个种子点。与求特征点主方向时有所不同,此时,每个子区域的梯度方向直方图将0°~360°划分为8个方向范围,每个范围为45°,这样,每个种子点共有8个方向的梯度强度信息。由于存在4X4Bp X Bp)个子区域,所以,共有4X4X8=128个数据,最终形成128维的SIFT特征矢量。同样,对于特征矢量需要进行高斯加权处理,加权采用方差为mσBp/2的标准高斯函数,其中距离为各点相对于特征点的距离。使用高斯权重的是为了防止位置微小的变化给特征向量带来很大的改变,并且给远离特征点的点赋予较小的权重,以防止错误的匹配。

 SIFT特征匹配算法介绍——寻找图像特征点的原理SIFT特征匹配算法介绍——寻找图像特征点的原理

 

    在最后,对特征向量进行归一化处理,去除光照变化的影响

 

 

8.使用特征检测器

Opencv提供FeatureDetector实现特征点检测。

最后把所检测到的特征点放置在一个容器中,再进行后续的图像匹配工作。

至此,SIFT特征匹配算法讲解结束。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/150151.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)
blank

相关推荐

  • 深入解析HashMap和currentHashMap源码以及实现原理「建议收藏」

    深入解析HashMap和currentHashMap源码以及实现原理「建议收藏」深入解析HashMap和ConcurrentHashMapy源码以及底层原理前言HashMap和ConcurrentHashMap,这两个相信大家都不陌生,在面试中基本上是必问的,以及在实际开发过程中也是比用的,那么看了这篇文章,无论在面试还是在实际开发中都可以顺手拈来,得心应手了。HashMap基于Map接口实现,元素以键值对的方式存储,并且允许使用null建和null 值, 因为key不允许重复,因此只能有一个键为null,另外HashMap不能保证放入元素的顺序,它是无序的,和放入的顺序并

  • mysql datetime与timestamp区别

    mysql datetime与timestamp区别datetime:1、与时区无关,存入的是什么值就是什么值,不会根据当前时区进行转换2、从mysql5.6.4中,可以存储小数片段,最多到小数点后6位,显示时格式为yyyy-MM-ddHH:mm:ss[.222222]mysql5.5中,没有小数片段。所以,我再从5.6版本迁移到5.5版本时,因为生成的sql中datetime(6),所以无法导入数据库。3、存储

    2022年10月27日
  • 芯片的架构_意法半导体

    芯片的架构_意法半导体在了解这些架构之前,我们应该先了解一下复杂指令集(CISC)和精简指令集(RISC)。怎么说这两个的区别呢?CISC的设计思路更加注重性能的发展,是一种高性能高功耗的芯片,在高密度的计算上更具有优势;RISC的设计思路更注重低功耗小尺寸,多用于移动端设备,在重复性任务上占优。举一个简单的例子来说明这个情况,我们在B站上常说的一键三连,CISC会把“点赞”“投币”“收藏”整理成一条指令在缓存中,再由处理器处理;但是对于RISC来说就是三条指令了先“点赞”再“投币”最后“收藏”,这样做的缺点就是很依赖内存带宽了

  • FZU 1686 龙之谜 重复覆盖

    FZU 1686 龙之谜 重复覆盖

  • 哈希算法是对称算法还是非对称算法_对称加密和非对称加密原理

    哈希算法是对称算法还是非对称算法_对称加密和非对称加密原理哈希算法和·Hmac算法

    2022年10月23日
  • 不会部署并调试SpringBoot源码?一看必会IDEA操作[通俗易懂]

    不会部署并调试SpringBoot源码?一看必会IDEA操作[通俗易懂]SpringBoot现在这么火几乎是面试必问,如果你能说出点源码是如果实现的,那么面试官跟定对你刮目相看。但是好多同学往往在部署SpringBoot源码的时候,由于找不到门路而选择放弃。本篇博客通过简单方式教你如果将SpringBoot源码导入IDEA并对其进行调试,对核心的代码添加自己注释内容。

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号