吴恩达机器学习笔记 三十二 K-means初始化 选择聚类数量

K-means 初始化

首先 K  < m,若集群的数量多于样本数显然是不合理的。

第一步:随机选取 K 个样本;

第二步:设这 K 个样本为 μ1 μ2 ... μk

有时候K-meas 算法会出现局部最小值的情况,如左下图和右下图,因此应当多次运行 K-means 算法 ,取成本 J 最小的那个。

随机初始化的步骤如下,通常50-1000次是正常的,次数太多计算成本会很高。 

 

聚类数量的选择

 一种方法是肘方法(elbow method), 把 J 当做是集群数量 K 的函数,选择函数弯曲的地方(即手肘)作为 K 的值。

另一种方法是根据后续的工作进行评估 ,例如调整T恤衫的尺寸,可以分为三类,也可以分为五类,但两种情况下T恤衫的合适程度以及生产成本不同,需要根据这些进行选择。

最近更新

  1. TCP协议是安全的吗?

    2024-04-01 22:14:09       16 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-04-01 22:14:09       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-04-01 22:14:09       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-04-01 22:14:09       18 阅读

热门阅读

  1. 潍坊如何申请专利

    2024-04-01 22:14:09       14 阅读
  2. RTOS--异常向量和中断向量

    2024-04-01 22:14:09       13 阅读
  3. c++计算浮点数相除的余

    2024-04-01 22:14:09       16 阅读
  4. C++20中的jthread

    2024-04-01 22:14:09       11 阅读
  5. 密码攻击

    2024-04-01 22:14:09       11 阅读
  6. SpringBoot单元测试

    2024-04-01 22:14:09       16 阅读
  7. 日常有疑惑的点总结

    2024-04-01 22:14:09       11 阅读
  8. Linux共享网络给其它主机

    2024-04-01 22:14:09       13 阅读
  9. FastAPI+React全栈开发13 FastAPI概述

    2024-04-01 22:14:09       11 阅读
  10. C# 字符串转json

    2024-04-01 22:14:09       16 阅读