【Python机器学习】NMF——模拟数据

与使用PCA不同,我们需要保证数据是正的,NMF能够对数据进行操作。这说明数据相对于原点(0,0)的位置实际上对NMF很重要。因此,可以将提取出来的非负向量看作是从(0,0)到数据的方向。

举例:NMF在二维玩具数据上的结果:

import mglearn.plots
import matplotlib.pyplot as plt

mglearn.plots.plot_nmf_illustration()
plt.show()

对于两个分量的NMF(左图),显然所有数据点都可以写成这两个分量的正数组合。如果有足够多的分量能够完美的重建数据(分量个数与特征个数相同),那么算法会选择指向数据极值的方向。

如果我们仅使用一个分量,那么NMF会创建一个指向平均值的分量,因为指向这里可以对数据做最好的解释。可以看到,与PCA不同,减少分量个数不仅会删除一些方向,而且会创建一组完全不同的分量。NMF的分量也没有按照任何特定方法排序,所以不存在“第一分量”,所有分量的地位平等。

NMF使用了随机初始化,根据随机种子的不同可能会产生不同的结果。在相对简单的情况下(比如两个分量的模拟数据),所有数据都可以被完美的解释,那么随机性的影响很小。在更加复杂的情况下,影响可能会很大。

相关推荐

  1. Python机器学习】非负矩阵分解(NMF

    2024-06-09 11:42:02       28 阅读
  2. python数据挖掘---机器学习模型

    2024-06-09 11:42:02       22 阅读
  3. Python地理数据机器学习数学

    2024-06-09 11:42:02       64 阅读
  4. Python | 机器学习数据清洗

    2024-06-09 11:42:02       62 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-06-09 11:42:02       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-06-09 11:42:02       101 阅读
  3. 在Django里面运行非项目文件

    2024-06-09 11:42:02       82 阅读
  4. Python语言-面向对象

    2024-06-09 11:42:02       91 阅读

热门阅读

  1. 「前端+鸿蒙」鸿蒙应用开发-TS函数

    2024-06-09 11:42:02       26 阅读
  2. 轻量管理内核复杂级别的项目

    2024-06-09 11:42:02       28 阅读
  3. Float浮动

    2024-06-09 11:42:02       29 阅读
  4. Android 日志实时输出

    2024-06-09 11:42:02       32 阅读
  5. 力扣1248.统计优美子数组

    2024-06-09 11:42:02       27 阅读
  6. 定位器追踪器怎么连接手机

    2024-06-09 11:42:02       23 阅读
  7. PySpark教程 (一)概述pyspark

    2024-06-09 11:42:02       26 阅读
  8. 前端面试题日常练-day58 【面试题】

    2024-06-09 11:42:02       30 阅读
  9. 前端怎么实现跨域请求?

    2024-06-09 11:42:02       34 阅读
  10. 达梦数据库(DMDB)基本使用

    2024-06-09 11:42:02       28 阅读