图像配准之HomographyNet

        文章名称:Deep Image Homography Estimation,论文地址:https://arxiv.org/pdf/1606.03798.pdf,代码地址:GitHub - mazenmel/Deep-homography-estimation-Pytorch: Deep homography network with Pytorch

1、背景介绍

        单应性原理被广泛应用于图像配准,全景拼接,机器人定位SLAM,AR增强现实等领域,下图为单应矩阵在图像拼接中的应用示例。

2、核心思想

        HomographyNet是发表在CVPR 2016的一种用深度学习计算单应性变换的网络,即输入两张图,直接输出单应性矩阵H。核心思想为:

        a、用最简单的方式来理解,就是取参考帧图像和待配准图像相同大小的ROI区域。

        b、以参考帧图像ROI矩形的四个顶点为特征点,找到待配准图像ROI区域上对应这个4个点坐标位置。

        c、利用这4对匹配点,直接求解出单应性矩阵H,得到配准数据。

3、模型结构

        整体网络结构如下,输入为两张图,输出单应矩阵估计。

        使用cnn来求解单应性矩阵,通过两种方式,把它看成拟合或者分类问题。

3.1、分类方式预测

        使用cnn来求解单应性矩阵,通过两种方式,把它看成拟合或者分类问题:

3.2、回归方式预测(优)

4、数据生成

        数据生成示意图如下:

        a、参考帧图像非边缘区域随机选择框一个矩形ROI(step1 蓝色框位置),表示为patchA;

        b、蓝色框4个顶点以自身为中心,x,y坐标都在−ρ , ρ 范围内随意移动(也就是step2上那4个黄色框范围);

        c、根据移动后4个顶点(step3上绿色框),和原来的4个顶点(step3上蓝色框),组合成4对匹配的特征点,求解并应用单应性矩阵HAB,生成需要的待配准图像(step4所示图像);

        d、待配准图像上4个特征点,反向应用单应性矩阵Hba, 生成新的4个坐标点(step4上绿色框),得到和参考帧图像对应的patchB;

        e、最终得到的patchA和patchB就表示为网络输入,step3上绿色框和蓝色框稍的4对点坐标相对位置,就可以理解为网络训练的gt。

训练集生成:

        a、所有输入都转换为320x240大小灰度图;

        b、使用上一步提到的gt数据生成方式,得到500000组128x128大小的训练数据块。

测试集生成:

        a、随机选择5000张图像,都转换为640x480大小灰度图;

        b、每张图取256x256 patch块,ρ取64,生成对应测试数据。

5、实验测试

        在存在大量无纹理区域,导致传统算法找不到足够特征点,或者说特征点分布明显不均匀情况下,本文方法有明显优势;但是,纹理丰富场景时,并无明显优势。

        一些简单场景可以考虑简化使用,毕竟网络结构简单,易实现,可通过训练弥补特征点方法的不足。测试误差,略优于传统方法。但实际上,基于深度学习的方法,均存在泛化问题,场景纹理丰富时,还有优先考虑基于特征点的方法。

参考资料:

1、单应性Homography估计:从传统算法到深度学习

单应性Homography估计:从传统算法到深度学习 - 知乎

2、Keras = 2.1.2 代码实现

GitHub - 4nthon/HomographyNet_Keras: Implementation of homographiynet with keras

3、pytorch=1.6 代码实现

GitHub - mazenmel/Deep-homography-estimation-Pytorch: Deep homography network with Pytorch

4、图像配准:从SIFT到深度学习

图像配准:从SIFT到深度学习 | 码农家园

5、西安电子科技大学权老师报告

未来之星 | 基于深度学习的遥感影像配准研究(视频)

相关推荐

  1. 图像概述

    2024-02-15 07:50:02       13 阅读
  2. KAZE+GTM 图像标定 Matlab 实现

    2024-02-15 07:50:02       36 阅读
  3. simpleitk

    2024-02-15 07:50:02       36 阅读
  4. 基于改进的SAR-SIFT算法的SAR图像附Matlab代码

    2024-02-15 07:50:02       37 阅读
  5. (3)Elastix图像:项目实战(2D / 3D)

    2024-02-15 07:50:02       36 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-02-15 07:50:02       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-02-15 07:50:02       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-02-15 07:50:02       19 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-02-15 07:50:02       20 阅读

热门阅读

  1. 2024.2.14作业

    2024-02-15 07:50:02       39 阅读
  2. 【docker 的常用命令——详细讲解】

    2024-02-15 07:50:02       28 阅读
  3. 甲辰年正月初五情人节

    2024-02-15 07:50:02       31 阅读
  4. AutoSAR(基础入门篇)9.1-协议数据单元PDU

    2024-02-15 07:50:02       35 阅读
  5. 如何学习机器学习和深度学习: 软件工程师指南

    2024-02-15 07:50:02       36 阅读
  6. 假期作业 2月14日

    2024-02-15 07:50:02       31 阅读
  7. 盐值1111

    2024-02-15 07:50:02       31 阅读
  8. elasticSearch使用场景深入详解

    2024-02-15 07:50:02       30 阅读
  9. SpringAOP的实现原理

    2024-02-15 07:50:02       31 阅读