【Python机器学习】观察数据&散点图矩阵

构建机器学习模型前,通常要检查数据,判断不用机器学习能不能轻松完成任务,或者需要的信息有没有包含在数据中。检查数据也是发现异常值和特殊值的好办法。

检查数据的最佳方法之一就是可视化,一种是绘制散点图,将一个特征作为x轴,另一个作为y轴,将每个数据点绘制为图上的点。为了解决3个或更多特征的数据集作图的问题,可以绘制散点图矩阵。

以鸢尾花数据集为例,首先将Numpy数组转换为pandas DataFrame。pandas有一个绘制散点图矩阵的函数,叫做scatter_matrix。

import mglearn
import matplotlib.pyplot as plt

iris_dataset=load_iris()
X_train,X_test,y_train,y_test=train_test_split(
    iris_dataset['data'],iris_dataset['target'],random_state=0
)
iris_dataframe=pd.DataFrame(X_train,columns=iris_dataset.feature_names)
grr=pd.plotting.scatter_matrix(iris_dataframe,c=y_train,figsize=(15,15),marker='0',hist_kwds={'bins':20},s=60,alpha=.8,cmap=mglearn.cm3)
plt.show()

 

相关推荐

  1. python绘制

    2024-01-06 16:46:02       35 阅读
  2. python绘制三维

    2024-01-06 16:46:02       35 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-01-06 16:46:02       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-01-06 16:46:02       100 阅读
  3. 在Django里面运行非项目文件

    2024-01-06 16:46:02       82 阅读
  4. Python语言-面向对象

    2024-01-06 16:46:02       91 阅读

热门阅读

  1. 如何停止一个运行中的Docker容器

    2024-01-06 16:46:02       65 阅读
  2. 步进电机调速原理

    2024-01-06 16:46:02       48 阅读
  3. vs c++ qt 叫请求的json 输出到输出终端

    2024-01-06 16:46:02       43 阅读
  4. 优医问诊H5 Vue3+TS+Pinia+Vant源码。

    2024-01-06 16:46:02       46 阅读
  5. 缓冲和缓存的区别

    2024-01-06 16:46:02       58 阅读
  6. 数据结构-怀化学院期末题(489)

    2024-01-06 16:46:02       54 阅读
  7. 【Python_PySide学习笔记(目录)】

    2024-01-06 16:46:02       54 阅读