昇思25天学习打卡营第13天|K近邻算法实现红酒聚类

K近邻算法(K-Nearest-Neighbor, KNN)是一种用于分类和回归的非参数统计方法,是机器学习最基础的算法之一。它正是基于以上思想:要确定一个样本的类别,可以计算它与所有训练样本的距离,然后找出和该样本最接近的k个样本,统计出这些样本的类别并进行投票,票数最多的那个类就是分类的结果。KNN的三个基本要素:

K值,一个样本的分类是由K个邻居的“多数表决”确定的。K值越小,容易受噪声影响,反之,会使类别之间的界限变得模糊。

距离度量,反映了特征空间中两个样本间的相似度,距离越小,越相似。常用的有Lp距离(p=2时,即为欧式距离)、曼哈顿距离、海明距离等。

如果两个东西是可以分类的,只要把这个东西的每个属性当成一个维度数据输入,那么一定是可以分开的。

类似下图数据,必然存在一条虚线,可以把他们分为两类。
在这里插入图片描述
如果是三维的数据,可以找到二维面把他们分开。依此类推…
在这里插入图片描述

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-07-11 10:44:04       101 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-07-11 10:44:04       108 阅读
  3. 在Django里面运行非项目文件

    2024-07-11 10:44:04       91 阅读
  4. Python语言-面向对象

    2024-07-11 10:44:04       98 阅读

热门阅读

  1. MySQL语句

    2024-07-11 10:44:04       23 阅读
  2. Flask+Layui开发案例教程

    2024-07-11 10:44:04       23 阅读
  3. mysql面试题 Day6

    2024-07-11 10:44:04       28 阅读
  4. 人工智能在自动驾驶中的目标检测研究

    2024-07-11 10:44:04       29 阅读
  5. 编程语言 Public:深度解析与未来展望

    2024-07-11 10:44:04       30 阅读
  6. 【SQL】InnoDB中的行锁

    2024-07-11 10:44:04       30 阅读
  7. 编程什么好用:深入剖析编程工具的选择与运用

    2024-07-11 10:44:04       27 阅读
  8. C++引用和指针的区别

    2024-07-11 10:44:04       24 阅读
  9. 3.数组基础

    2024-07-11 10:44:04       21 阅读