『大模型笔记』主成分分析(PCA)解释:简化机器学习中的复杂数据!

主成分分析(PCA)解释:简化机器学习中的复杂数据

一. 主成分分析(PCA)解释:简化机器学习中的复杂数据!

在这里插入图片描述

主成分分析(Principal Component Analysis,简称PCA)通过 将大型数据集中的维度减少到能够保留大部分原始信息的主成分,从而减少数据的维度

让我给你举个例子,说明为什么这很重要。假设在一个风险管理的场景中,我们想要了解哪些贷款彼此相似,以便理解哪些类型的贷款通常会还清,哪些类型的贷款风险较高。请看这张表,显示了六笔贷款的数据。这些贷款包含多个维度,例如贷款金额、申请人的信用评分等。虽然这里只显示了四个维度,但贷款实际上包含更多的维度。例如,借款人的年龄和收入债务比也是重要维度。

PCA是一种找出最重要维度或主成分的方法。直观上讲,我们知道在考虑风险时,有些维度比其他维度更重要。例如,信用评分可能比借款人在当前工作中的工作年限更重要。如果我们去除这些不重要或不太重要的维度,我们会看到两个主要好处:一是机器学习的训练和推理速度会更快,因为要处理的数据更少,维度更少;其次,如果只有两个维度࿰

相关推荐

最近更新

  1. TCP协议是安全的吗?

    2024-06-18 14:54:05       16 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-06-18 14:54:05       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-06-18 14:54:05       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-06-18 14:54:05       18 阅读

热门阅读

  1. PHP中的for循环:多方面探讨与实际应用

    2024-06-18 14:54:05       8 阅读
  2. Qt 插件框架

    2024-06-18 14:54:05       8 阅读
  3. 力扣1385.两个数组间的距离值

    2024-06-18 14:54:05       7 阅读
  4. 【Python高级编程】使用OpenCV进行图像旋转详解

    2024-06-18 14:54:05       7 阅读
  5. CSS行内样式书写规范及注意事项

    2024-06-18 14:54:05       5 阅读
  6. 查看mysql数据库端口号

    2024-06-18 14:54:05       7 阅读
  7. 美股 — “四巫日”

    2024-06-18 14:54:05       9 阅读
  8. MyBatis 插件机制详解

    2024-06-18 14:54:05       8 阅读
  9. 富格林:可信守则有效防范暗箱

    2024-06-18 14:54:05       9 阅读
  10. 2024.6.17总结1113

    2024-06-18 14:54:05       9 阅读
  11. AI之Lambda index

    2024-06-18 14:54:05       8 阅读
  12. python中的结构

    2024-06-18 14:54:05       7 阅读