【超音速 专利 CN117576413A】基于全连接网络分类模型的AI涂布抓边处理方法及系统

申请号 CN202311568976.4
公开号(公开) CN117576413A
申请日 2023.11.22
申请人(公开) 超音速人工智能科技股份有限公司
发明人(公开) 张俊峰(总); 杨培文(总); 沈俊羽; 张小村

我的理解

步骤一:获取涂布边缘图像并提取对应的关键点特征;
步骤二:采用卷积以及全连接操作对所述关键点特征进行分析,通过分类头确定关键点的纵坐标、横坐标以及可见性;
步骤三:构建全连接网络分类模型并训练至损失函数收敛,将所述关键点的纵坐标、横坐标以及可见性输入到所述全连接网络分类模型,提取出虚边、融合边和实边在涂布边缘图像边缘处的关键点坐标;
步骤四:将涂布边缘图像的关键点的纵坐标、横坐标以及可见性并输入到完成训练的全连接网络分类模型进行检测并获取虚边、融合边和实边在涂布边缘图像边缘处的关键点坐标,根据关键点坐标确定虚边、融合边和实边的位置。
2.根据权利要求1所述的基于全连接网络分类模型的AI涂布抓边处理方法,其特征在于,所述获取涂布边缘图像并提取对应的关键点特征,包含以下步骤:
获取涂布原始图像并进行预处理将图片转换为统一的格式,所述预处理包括以下一种或多种方式:缩放、裁剪、灰度增强、对比度增强;
通过边缘提取算法确定预处理后的涂布原始图像的第一边缘位置,以第一边缘位置为中心对涂布原始图像进行裁剪,生成涂布边缘图像;
对所述涂布边缘图像进行数据标注,使用带有预训练模型的特征提取网络提取所述涂布边缘图像的关键点特征。
步骤四.根据权利要求1所述的基于全连接网络分类模型的AI涂布抓边处理方法,其特征在于,所述采用卷积以及全连接操作对所述关键点特征进行分析,通过分类头确定关键点的纵坐标、横坐标以及可见性,包括:
所述分类头包含纵坐标分类头、横坐标分类头以及可见性分类头;
通过纵坐标分类头确定关键点的纵坐标,通过横坐标分类头确定关键点的横坐标,通过可见性分类头确定关键点的可见性。
步骤五.根据权利要求3所述的基于全连接网络分类模型的AI涂布抓边处理方法,其特征在于,所述采用卷积以及全连接操作对所述关键点特征进行分析,通过分类头确定关键点的纵坐标、横坐标以及可见性,还包含:
纵坐标分类头通过一维卷积以及全连接操作将图像特征变换成N个一维向量,表示关键点的纵坐标;
横坐标分类头通过一维卷积以及全连接操作将图像特征变换成N个一维向量,表示关键点的横坐标;
可见性分类头通过二维卷积以及全连接操作将图像特征变换成一个长度为N的一维向量,表示关键点的可见性。
步骤六.根据权利要求4所述的基于全连接网络分类模型的AI涂布抓边处理方法,其特征在于,所述通过纵坐标分类头确定关键点的纵坐标,通过横坐标分类头确定关键点的横坐标,通过可见性分类头确定关键点的可见性,还包含:
纵坐标分类头首先对提取的关键点特征通过二维卷积和ReLU激活函数压缩特征;将压缩特征的横坐标方向特征进行展平,进行全连接操作及ReLU激活函数,将其特征维度转变为涂布边缘图像高度的ɑ倍;进行尺度不变的横坐标方向一维卷积操作,得到关键点的纵坐标分类头输出结果;
横坐标分类头首先对提取的关键点特征通过二维卷积和ReLU激活函数压缩特征;接下来将压缩特征的纵坐标方向特征进行展平,进行全连接操作及ReLU激活函数,将其特征维度转变为原图像宽度的ɑ倍;最后,进行尺度不变的纵坐标方向一维卷积操作,得到关键点的横坐标分类头输出结果;
可见性分类头首先对提取的关键点特征经过两次二维卷积将特征长宽进行压缩,再将其进行全局池化、展平、以及全连接操作后得到关键点的可见性分类头输出结果。
步骤七.根据权利要求1所述的基于全连接网络分类模型的AI涂布抓边处理方法,其特征在于,所述获取涂布边缘图像并提取对应的关键点特征,包含:
获取涂布边缘图像,在图像边缘逐渐向外填充特定颜色的像素,每一圈像素的颜色均相同,并保持相邻圈层之间的色度差和饱和度差设定在特定范围内;
将图像标注数据中位于图像边缘的关键点标签移至填充的像素区域最外圈。
步骤八.根据权利要求6所述的基于全连接网络分类模型的AI涂布抓边处理方法,其特征在于,包含:
所述全连接网络分类模型进行推理时需要根据不同关键点类型将预测的关键点移至图像边缘处;
所述全连接网络分类模型提取的关键点包括虚边、实边、融合边在图像边缘位置的两个关键点坐标,根据两点确定一条直线的原理确定虚边、融合边和实边的位置。
步骤九.一种基于全连接网络分类模型的AI涂布抓边处理系统,包括:
处理模块,用于获取涂布边缘图像并提取对应的关键点特征;
分析模块,采用卷积以及全连接操作对所述关键点特征进行分析,通过分类头确定关键点的纵坐标、横坐标以及可见性;
训练模块,构建全连接网络分类模型并训练至损失函数收敛,将所述关键点的纵坐标、横坐标以及可见性输入到所述全连接网络分类模型,提取出虚边、融合边和实边在涂布边缘图像边缘处的关键点坐标;
检测模块,将涂布边缘图像的关键点的纵坐标、横坐标以及可见性并输入到完成训练的全连接网络分类模型进行检测并获取虚边、融合边和实边在涂布边缘图像边缘处的关键点坐标,根据关键点坐标确定虚边、融合边和实边的位置。
步骤十.一种计算机设备,其特征在于,包括处理器和存储器,所述存储器用于存储可执行的指令,所述指令用于控制所述处理器执行根据权利要求1至7中任一项所述的方法。
步骤十二.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序在被处理器执行时实现如权利要求1至7中任一项所述的方法。


如果有不明白的,请加文末QQ群。

扩展阅读

视频课程

先学简单的课程,请移步CSDN学院,听白银讲师(也就是鄙人)的讲解。
https://edu.csdn.net/course/detail/38771

如何你想快速形成战斗了,为老板分忧,请学习C#入职培训、C++入职培训等课程
https://edu.csdn.net/lecturer/6176

相关推荐

我想对大家说的话
喜缺全书算法册》以原理、正确性证明、总结为主。
按类别查阅鄙人的算法文章,请点击《算法与数据汇总》。
有效学习:明确的目标 及时的反馈 拉伸区(难度合适) 专注
闻缺陷则喜(喜缺)是一个美好的愿望,早发现问题,早修改问题,给老板节约钱。
子墨子言之:事无终始,无务多业。也就是我们常说的专业的人做专业的事。
如果程序是一条龙,那算法就是他的是睛

测试环境

操作系统:win7 开发环境: VS2019 C++17
或者 操作系统:win10 开发环境: VS2022 C++17
如无特殊说明,本算法用**C++**实现。

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-14 15:54:02       67 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-14 15:54:02       72 阅读
  3. 在Django里面运行非项目文件

    2024-07-14 15:54:02       58 阅读
  4. Python语言-面向对象

    2024-07-14 15:54:02       69 阅读

热门阅读

  1. 机器学习之常用优化器

    2024-07-14 15:54:02       25 阅读
  2. C++常用算法的简单总结

    2024-07-14 15:54:02       25 阅读
  3. 渗透测试 —— 揭开数字安全的隐形面纱

    2024-07-14 15:54:02       20 阅读
  4. Linux设置开机自启动脚本

    2024-07-14 15:54:02       27 阅读
  5. Visual Studio 配置记录 - 备忘

    2024-07-14 15:54:02       20 阅读
  6. P3743 小鸟的设备

    2024-07-14 15:54:02       20 阅读
  7. 【前端】css控制背景图片缩放

    2024-07-14 15:54:02       24 阅读
  8. Leetcode【最长回文子串】

    2024-07-14 15:54:02       20 阅读
  9. Matlab中产生高斯白噪声信号的方法和其功率计算

    2024-07-14 15:54:02       28 阅读