一文讲透鱼眼相机畸变矫正，及目标检测项目应用值得收藏

大家好，又见面了，我是你们的朋友全栈君。

个人介绍

大家好，我是潘大强。

目前博士毕业4年，主要从事智能安防行业。

之前也分享过AI从业的一些心得，个人介绍链接。

应大白的邀请，从AI从业者的角度，分享工作中遇到的一些经验。

之前在江大白的群里，看到有同学提问“鱼眼相机标定”的问题。

对于鱼眼相机的标定和矫正，网上已经有很多理论文章，但是落实到代码层面的并不多，而且大部分代码都是C++实现。

但是做AI的同学，大多数都是用python语言，所以本次分享，我用python语言（只依赖opencv-python包和numpy包），把之前做的鱼眼矫正和变形的相关经验，以实践为目的，一步步分享给大家。

首先我们来了解一下鱼眼相机，和平时普通相机拍摄出的效果不同，鱼眼相机通常固定在空间顶部，所以拍摄出的视角是这样的：

大家可以看到，鱼眼图像类似于把很大角度范围内的光线，进行「压缩」和「扭曲」，将图像压进一个相对较小的空间内。

鱼眼相机采用的是鱼眼镜头，它的前镜组具有一个极凸的镜片表面，外形上看起来让人联想到鱼的眼睛，这就是“鱼眼”的由来。

那么在智能安防行业中，鱼眼相机可以做哪些应用呢？

最常见的，还是做目标追踪以及客流统计。

在目标追踪任务中，通常的球机或者枪机方案，无法避免人群遮挡的问题，从而导致较高的ID Swich，造成追踪不稳定。

但是鱼眼相机的顶视角安装方式，天然缓解了人群遮挡的问题。

在客流统计任务中，鱼眼相机利用视野大的优势，在同一空间中，可以顶X个枪机。

当然除了降低硬件成本，还能避免多相机检测导致的区域人数去重。

了解了鱼眼相机的原理和优势，但在实际项目中，我们会对鱼眼图像进行矫正和变形，作为最终应用的前置任务。

鱼眼相机的畸变校正

下面就进行了今天的正题：如何对相机做矫正变形？

无论是单目相机还是双目相机，拍摄的图像都会存在畸变。

它们和鱼眼相机的畸变矫正原理也是一样的：核心是求解一个“好”的重映射矩阵（remap matrix）。

从而将原图中的部分像素点（或插值点）进行重新排列，“拼”成一张矩形图。

“好”是跟最终需求挂钩的，不同任务往往采用不同的矫正/变形方案。

比如：

（1）单目相机的畸变矫正

对于单目相机，为了得到相机像素坐标系和三维世界坐标系的对应关系，我们需要对相机的桶形畸变和枕形畸变进行矫正。

（2）双目相机的畸变矫正

而对于双目相机，为了做极线对齐，实现深度估计。

我们需要将两个相机，输出变换到同一个坐标系下。

张正友老师的棋盘标定法，通过标志物的位置坐标，估计出相机的内外参数和畸变系数，从而计算出remap matrix。该方法是目前上述两类相机，矫正效果最好的方法。

（3）鱼眼相机的矫正变形

对于鱼眼相机，本次主要分享三种方法：棋盘标定法、横向展开法、经纬度法。

下面我们先来看一下各种方法的矫正效果。

鱼眼相机的三种矫正方法

下图是某款鱼眼相机的采集图像，而真正有效的监控区域，是内部的圆形区域。

（1）棋盘标定法

棋盘矫正法的目的，是将鱼眼图“天生”的桶形畸变进行矫正。

具体效果类似于“用手对着圆形中心做挤压，把它压平”，使得真实世界中的直线，在矫正后依然是直线。

采用棋盘标定法进行矫正后：

我们发现：

① 现实世界中的直线，在鱼眼图中发生了扭曲（如鱼眼图中的蓝色和绿色曲线），矫正后变成了直线（如正方形图中的蓝色和绿色直线）;

② 矫正图只占据了鱼眼图中间的一部分（如鱼眼图中的红色曲线）。

从这个矫正效果中，可以看出：棋盘标定法的缺点，是靠近圆周（外围区域）的区域，会被拉伸的很严重，视觉效果变差。

所以一般会进行切除，导致矫正后的图片只保留了原图的中间区域。

基于以上特点，在实际使用中，我会把棋盘标定法，作为简单测量的前置任务（矫正图中的两点距离和真实世界中的两点距离，存在一一对应的关系）。

也可以作为鱼眼图像拼接的前置任务（真实世界中的三点共线，在拼接图中依然共线）。

（2）横向展开法

横向展开法，主要是利用鱼眼相机的大FOV和俯视拍摄的特点，来进行变形。

比如我们把上图中的红点，想象成一个观察者，当他身体旋转360度，看到的什么样的画面呢？

上图是经过横向展开法，变形后的画面。

可以看到，从原先的俯视视角变为了正视视角。

因此可以根据区域功能，进行切片，再用普通视角的检测模型，做后续任务。

但是缺点也一目了然，比如展开图的左右两侧，在真实世界中应该是连通的。

所以当有目标在鱼眼图中穿过分界线时，在展开图中该目标会从左侧消失，右侧出现（或者倒过来），看起来不是很自然。

基于以上特点，在实际使用中，我会利用鱼眼相机，覆盖面积大的特点（比如3米层高的情况下，至少覆盖100平米），在“某些场景”中取代枪机或半球机，画面展开后用正常的检测器去完成后续任务。

这里还要补充两点：

① COCO数据集上训练的人体检测器，在鱼眼图中直接使用是不会work的;

② 与棋盘标定法不同，横向展开不会损失像素，所以展开图也可以再remap回鱼眼原图。

（3）经纬度法

经纬度法主要分为两个方面：

① 经度

下图是鱼眼图沿着经度对齐矫正后的画面。

该方法与棋盘矫正法相比，没有像素损失，也不需要标定（人为设计规则求解remap matrix）。

但是缺点也很明显，它只对竖直方向（图中的蓝色线和绿色线）进行了矫正，而水平方向（红色线）依然是扭曲的。

② 纬度

下图是鱼眼图沿着纬度对齐矫正后的画面。

可以看到，只对水平方向（图中的蓝色线和绿色线）进行了矫正，而竖直方向（红色线）依然是扭曲的。

基于以上特点，在实际落地中，我没有采用经纬度矫正法。

更多的是在学习和研究阶段，把它当作设计和计算remap matrix的一个作业。

三种矫正方法的代码实现

了解上面三种矫正效果的原理，下面我们再来看一下具体的算法实现。

无论采用以上哪种方法，最核心的部分是求解remap matrix，具体到之后的代码中就是mapx和mapy两个变量。

它们反映了矫正图中的像素坐标和原始图像素坐标之间的对应关系。

如果我们把原图记为image， mapx和mapy表示以上三种方法求出的不同的映射矩阵，那么通过原图和映射矩阵，就可以得到矫正/变形后的图像，记为image_remap。

其中 mapx和mapy 的shape都是 ( image_remap.shape[0], image_remap.shape[1] )。

且“mapx[i, j]=m 和 mapy[i, j]=n” 表示 “image_remap的第i行、第j列的像素值，等于image的第n行、第m列的像素”，其中m, n允许是非整数。

下面我针对以上三种方法，依次贴出代码实现和流程解释。