模式识别与机器学习-特征选择和提取

谨以此博客作为复习期间的记录。
常见分类问题的流程,数据预处理和特征选择提取时机器学习环节中最重要的两个流程。这两个环节直接决定了最终性能的上下限,本部分记录一下特征提取和选择部分(特征工程)
在这里插入图片描述
特征选择可以表示为:从一个包含 n 个度量值的集合 { x 1 , x 2 , … , x n } \{x_1, x_2, \dots, x_n\} { x1,x2,,xn} 中,按照某个准则选择出一个子集,用作分类的特征,这个子集具有降维的效果(m 维,其中 m < n)。

特征提取可以表示为:通过某种变换,将原始特征集合 ( x 1 , x 2 , … , x n ) (x_1, x_2, \dots, x_n) (x1,x2,,xn) 转换成一个包含 m 个新特征 ( y 1 , y 2 , … , y m ) (y_1, y_2, \dots, y_m) (y1,y2,,ym) 的集合(其中 m < n),这些新特征作为新的分类特征(有时称为二次特征)。

这两种方法的目的都在于在保留尽可能多的识别信息的前提下,降低特征空间的维度,以便有效地进行分类。

特征选择

一些距离测度公式

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

独立特征的选择准则

在这里插入图片描述

一般特征的散布矩阵准则

在这里插入图片描述

离散K-L变换

在这里插入图片描述
在这里插入图片描述

相关推荐

  1. 模式识别机器学习(十):梯度提升

    2023-12-27 10:52:02       35 阅读

最近更新

  1. TCP协议是安全的吗?

    2023-12-27 10:52:02       16 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2023-12-27 10:52:02       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2023-12-27 10:52:02       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2023-12-27 10:52:02       18 阅读

热门阅读

  1. 【zookeeper经典应用实战】

    2023-12-27 10:52:02       29 阅读
  2. FB混合C语言编译

    2023-12-27 10:52:02       36 阅读
  3. Linux创建Macvlan网络

    2023-12-27 10:52:02       46 阅读
  4. 鸿蒙插槽?全局插槽和局部插槽?数据不更新?

    2023-12-27 10:52:02       37 阅读
  5. Crow:Middlewares 庖丁解牛7 after_handlers_call_helper

    2023-12-27 10:52:02       37 阅读
  6. [c]扫雷

    [c]扫雷

    2023-12-27 10:52:02      41 阅读
  7. 轻量级Python IDE使用(四)——类

    2023-12-27 10:52:02       32 阅读