Python使用余弦相似度比较两个图片

为了使用余弦相似度来找到与样例图片相似的图片,我们需要先进行一些预处理,然后计算每两张图片之间的余弦相似度。以下是一个简单的实现:

  1. 读取样例图片和目标文件夹中的所有图片。
  2. 对每张图片进行预处理,例如灰度化、降噪等。
  3. 计算每张图片与样例图片的余弦相似度。
  4. 找到与样例图片最相似的图片并复制到指定目录。

首先,确保你已经安装了必要的库:

pip install opencv-python numpy Pillow scikit-image

以下是Python代码:

import cv2  
import numpy as np  
from skimage import io, img_as_ubyte  
from sklearn.metrics.pairwise import cosine_similarity  
from PIL import Image  
import os  
import shutil  
  
# 图片路径和目标路径  
sample_image_path = "测试图片\\356-1703817660893.jpg"  
image_folder = "未分类图片文件夹"  
output_folder = "输出图片文件夹"  
  
# 读取样例图片  
sample_image = cv2.imread(sample_image_path, cv2.IMREAD_GRAYSCALE)  
sample_image = img_as_ubyte(sample_image)  # 确保图片在0-255范围内  
sample_image = io.imread(sample_image)  # 使用skimage读取,确保是数组格式  
  
# 读取目标文件夹中的所有图片并预处理  
images = []  
for filename in os.listdir(image_folder):  
    img = cv2.imread(os.path.join(image_folder, filename), cv2.IMREAD_GRAYSCALE)  
    img = img_as_ubyte(img)  # 确保图片在0-255范围内  
    img = io.imread(img)  # 使用skimage读取,确保是数组格式  
    images.append(img)  
  
# 计算余弦相似度并找到最相似的图片  
similarities = []  
for image in images:  
    similarity = cosine_similarity(sample_image.reshape(-1, 1), image.reshape(-1, 1))[0][0]  
    similarities.append((similarity, image))  
similarities.sort(key=lambda x: x[0], reverse=True)  # 按相似度排序  
most_similar_image = similarities[0][1]  # 最相似的图片  
  
# 复制最相似的图片到指定目录  
output_filename = os.path.join(output_folder, "most_similar_" + os.path.basename(sample_image_path))  
shutil.copyfile(os.path.join(image_folder, os.path.basename(sample_image_path)), output_filename)  # 复制原样例图片到指定目录  
shutil.copyfile(os.path.join(image_folder, os.path.basename(most_similar_image)), output_filename)  # 复制最相似的图片到指定目录

注意:这个代码假设所有的图片都已经以灰度格式存储,并且大小相同。如果实际情况不是这样,你可能需要进行一些额外的预处理步骤,例如调整大小或转换为灰度。此外,对于大型图片集,计算余弦相似度可能会比较慢,因此你可能需要使用更高效的相似度计算方法或优化代码。

相关推荐

  1. Python使用余弦相似比较图片

    2024-01-02 08:58:02       40 阅读
  2. python opencv比较图片相似

    2024-01-02 08:58:02       25 阅读
  3. Python3】计算字符串的相似

    2024-01-02 08:58:02       39 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-01-02 08:58:02       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-01-02 08:58:02       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-01-02 08:58:02       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-01-02 08:58:02       20 阅读

热门阅读

  1. React16源码: Suspense与lazy源码实现

    2024-01-02 08:58:02       35 阅读
  2. 【PostgreSQL】从零开始:(四十一)约束-排他约束

    2024-01-02 08:58:02       27 阅读
  3. ubuntu设置显示应用程序

    2024-01-02 08:58:02       38 阅读
  4. redis

    redis

    2024-01-02 08:58:02      43 阅读
  5. 分布式【RPC 常见面试题】

    2024-01-02 08:58:02       36 阅读
  6. 举例说明计算机视觉(CV)技术的优势和挑战

    2024-01-02 08:58:02       40 阅读
  7. C语言【程序设计题10】

    2024-01-02 08:58:02       34 阅读