机器学习之K-medians聚类

K-medians聚类是一种聚类算法,类似于K-means,但是它使用中位数来确定簇的中心,而不是平均值。这种方法在处理数据中存在离群值或异常值时比较有用,因为中位数对离群值不敏感。K-medians的步骤与K-means类似,但在每次迭代中,它使用中位数来更新簇的中心。

K-medians的算法步骤如下:

  1. 初始化:随机选择K个数据点作为初始的簇中心。
  2. 分配:将每个数据点分配到距离其最近的簇中心所代表的簇。
  3. 更新中心:对于每个簇,使用该簇中所有数据点的中位数来更新簇中心。
  4. 重复迭代:重复执行分配和更新中心的步骤,直到簇中心不再发生显著变化或达到预定的迭代次数。

K-medians聚类是K-means的一种变体,适用于那些可能包含离群值或形状复杂的数据集。K-medians与K-means的不同之处在于:

  • K-medians使用中位数来计算簇中心,因此对离群值更加鲁棒。
  • K-medians需要计算点到中心的绝对距离,而K-means使用的是平方距离。

下面是关于K-medians聚类的一些特点:

  1. 工作原理

    • K-medians聚类的工作原理类似于K-means。它也需要指定簇的数量(K值)。
    • 算法的核心在于选择簇的中心(medians),以最小化每个数据点到其所属簇中心的中位数距离之和。
  2. 距离度量

相关推荐

  1. 机器学习K-medians

    2024-04-28 17:28:03       28 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-28 17:28:03       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-28 17:28:03       100 阅读
  3. 在Django里面运行非项目文件

    2024-04-28 17:28:03       82 阅读
  4. Python语言-面向对象

    2024-04-28 17:28:03       91 阅读

热门阅读

  1. [LLM]大模型训练DeepSpeed(三)

    2024-04-28 17:28:03       27 阅读
  2. 企业微信私有化部署对接oauth2.0

    2024-04-28 17:28:03       28 阅读
  3. 计算机网络复习(第一章概述)

    2024-04-28 17:28:03       27 阅读
  4. 2024.4.28每日一题

    2024-04-28 17:28:03       33 阅读