人工智能_机器学习081_聚类评价指标_轮廓系数_公式理解---人工智能工作笔记0121

然后我们再来看,那么对于数据来说,我们分成几类比较合适呢,怎么衡量呢?

我们之前做分类的时候,用的是准确率对吧,然后做回归问题的时候,用均方误差.

而我们在Kmeans衡量分成几类比较好用的函数是,轮廓系数对吧,可以看到上面是

轮廓系数的公式

可以看到,他有两个点  可以看到公式中的a和b

a,表示 某个样本 和 它所在的簇内的,其他样本的平均距离, 其实聚类分的好不好,主要是,我们希望一个类别,也就是一个簇中,的数据点,帖的越紧密越好对吧.

b.某个样本 与其他簇内样本的平均距离, 这个其实就是说簇 与 簇之间的距离越远越好对吧,就表示分的越开 对吧

所以根据公式我们可以看到,

假如当a=0 ,那么这个时候 S的值最大对吧,因为 分子最大 对吧,所以轮廓系数公式 的值越大越好

我们希望a越小越好,最小是0  然后b越大越好对吧.

这个就是轮廓系数公式,用来衡量 聚类算法分的好不好

相关推荐

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2023-12-29 11:28:04       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2023-12-29 11:28:04       100 阅读
  3. 在Django里面运行非项目文件

    2023-12-29 11:28:04       82 阅读
  4. Python语言-面向对象

    2023-12-29 11:28:04       91 阅读

热门阅读

  1. TensorFlow 的基本概念和使用场景。

    2023-12-29 11:28:04       50 阅读
  2. datax

    2023-12-29 11:28:04       67 阅读
  3. Linux 创建intellij-idea 快捷方式及其原理

    2023-12-29 11:28:04       56 阅读
  4. docker搭建私仓

    2023-12-29 11:28:04       48 阅读
  5. Webpack高频面试题

    2023-12-29 11:28:04       57 阅读
  6. Python实战案例之如何爬去电影,教程来了

    2023-12-29 11:28:04       48 阅读