一、主要内容
本文提出了一个基于扩散模型的多类异常检测框架(DiAD),旨在解决传统异常检测模型在处理多类别异常检测任务时面临的挑战,如类别错误和语义信息丢失等问题。
二、背景与动机
现有的异常检测模型大多对应单一类别,需要大量存储空间和训练时间,且随着类别数量的增加,这一需求会进一步增大。此外,传统模型在重建复杂纹理和大规模缺陷时存在局限性,无法很好地保留原始图像的语义信息。因此,迫切需要一种鲁棒且稳定的无监督多类别异常检测模型。
三、创新点
语义引导网络(SG网络):
提出了SG网络,用于在保留原始图像语义信息的同时重建异常区域。该网络通过引入语义引导机制,解决了现有扩散模型(如LDM)在多类别异常检测中的语义信息丢失问题。
空间感知特征融合块(SFF块):
引入了SFF块,以在处理大量重建区域时最大限度地提高重建精度。SFF块通过整合不同尺度的特征,实现了对原始正常样本信息的保留和大规模异常区域的重建。
多尺度特征提取与异常评分:
使用预训练的特征提取器对输入图像和重建图像进行处理,根据不同尺度提取的特征生成异常图。通过计算重建图像和输入图像在不同尺度特征上的差异,生成异常评分图,从而有效地进行异常定位和检测。
四、模型框架
DiAD框架主要由以下几个部分组成:
像素空间自编码器:用于压缩图像并提取特征。
连接稳定扩散去噪网络的潜在空间语义引导(SG)网络:
SG网络包括一系列编码块和解码块,以及一个SFF模块。该网络在潜在空间中进行扩散和去噪操作,并通过语义引导机制保持输入图像的语义信息。
特征空间预训练的特征提取器:处理输入图像和重建图像,提取不同尺度的特征图,并生成异常评分图。
五、实验与结果
论文中进行了多组实验来验证DiAD框架的有效性,包括与现有扩散模型(如DDPM和LDM)的对比实验。实验结果表明,DiAD框架在多类别异常检测任务中表现出色,能够准确地定位和检测异常区域,同时保留原始图像的语义信息。
DiAD框架通过引入语义引导网络和空间感知特征融合模块,解决了现有扩散模型在多类别异常检测中的不足,提高了模型在复杂纹理和大规模缺陷重建中的性能。未来工作可以进一步探索该框架在不同领域和场景下的应用,并优化模型结构和参数设置以提高检测精度和效率。