K-means 算法的原理简介

2024-02-02 13:54:02
开发
31

K-means 是数据科学和商业的基本算法。只需 4 分钟即可了解需要 4 周时间才弄清楚的内容。让我们深入了解一下。

1. K-means是一种流行的用于聚类的无监督机器学习算法。它是用于客户细分、库存分类、市场细分甚至异常检测的核心算法。

2. 无监督：K-means 是一种无监督算法，用于没有标签或预定义结果的数据。目标不是预测目标输出，而是通过识别数据集中的模式、聚类或关系来探索数据的结构。

3. 目标函数：K-means 的目标是最小化簇内平方和（WCSS）。它通过一系列迭代步骤（包括分配和更新步骤）来实现这一点。

4. 分配步骤：在此步骤中，将每个数据点分配给最近的聚类质心。“最近”通常使用欧几里得距离来确定。

5.更新步骤：重新计算质心作为簇中所有点的平均值。每个质心是其簇中点的平均值。

6.迭代：重复分配和更新步骤，直到质心不再发生显着变化，表明集群稳定。此过程最大限度地减少了簇内方差。

7. 输出：聚类质心、标签和距离平方和。质心代表每个聚类中所有点的平均位置，对于解释聚类结果至关重要。标签是聚类分配。距离平方和是簇中每个点距簇质心距离的度量。

8. 评估。有多种评估 K 均值的方法。两种常见的方法是剪影评分法和肘部法。

9. Silhouette Score：该指标衡量数据点与其他集群相比与其自身集群的相似程度。轮廓得分范围从 -1 到 1，其中高值表示数据点与其自己的簇匹配良好，而与相邻簇匹配较差。

10. 肘部法：该方法涉及将惯性绘制为簇数量的函数，并在图中寻找“肘部”。下降率急剧变化的肘点对于簇数来说是一个不错的选择。

原文地址:https://blog.csdn.net/qq_35582643/article/details/135945158 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1753295691515564032.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

相关推荐

K-means 算法的原理简介

2024-02-02 13:54:02 32 阅读
K-means 算法简介

2024-02-02 13:54:02 35 阅读
K-MEANS 算法的简单实现

2024-02-02 13:54:02 6 阅读
K-means算法通俗原理及Python与R语言的分别实现

2024-02-02 13:54:02 36 阅读
K-Means 算法详解

2024-02-02 13:54:02 31 阅读
Matlab：K-means算法

2024-02-02 13:54:02 33 阅读
spark MLlib (DataFrame-based) 中的聚类算法Bisecting K-Means、K-Means、Gaussian Mixture

2024-02-02 13:54:02 6 阅读
K-means 聚类算法

2024-02-02 13:54:02 37 阅读
机器学习K-means算法

2024-02-02 13:54:02 18 阅读
算法金 | 再见！！！K-means

2024-02-02 13:54:02 8 阅读