Python绘制对角矩阵代码分享

代码思路 

这段代码的主要思路是生成一个模拟的企鹅数据集,并使用Seaborn库中的可视化函数对其进行可视化。数据集包括四个数值列(嘴长度、嘴深度、鳍长和体重)和一个分类列(物种),其中包含三种可能的物种。为了模拟现实数据集,该数据集中还添加了一些缺失值。接下来,代码使用不同的Seaborn可视化函数来对数据集进行可视化,包括散点图矩阵、小提琴图和带有核密度估计曲线的散点图矩阵。这些图表可以帮助我们更好地了解数据集中的模式和关系,并帮助我们进行进一步的分析。

这段代码主要使用了以下三个Python库:

  1. pandas: 用于数据处理和分析,可以读取、处理和存储各种类型的数据,包括CSV、Excel等格式。

  2. numpy: 一个Python数学库,提供了大量的数学函数和方法,尤其是对于数组和矩阵的操作。

  3. seaborn: 基于matplotlib库的高级数据可视化库,提供了许多直观、美观和有用的图表类型和样式。Seaborn旨在使可视化更加简单和快捷,尤其适用于数据科学和统计分析。

Seaborn是一个基于matplotlib库的Python高级数据可视化库,旨在提供一组美观、直观和有用的图表类型和样式。它专为数据科学和统计分析而设计,可以轻松地创建各种类型的图表,包括散点图、折线图、条形图、热力图、小提琴图等。Seaborn具有以下特点:

  1. 美观:Seaborn提供了一套默认的颜色主题和样式,使得图表看起来更加精美和专业。

  2. 直观:Seaborn提供了许多易于理解的图表类型和样式,以帮助用户更好地理解数据集中的模式和关系。

  3. 有用:Seaborn提供了许多有用的图表类型和方法,例如回归分析、聚类分析、分布分析等,可以帮助用户进行深入的数据分析和探索。

  4. 简单快捷:Seaborn提供了简单而灵活的API,使得用户可以快速构建和修改各种类型的图表,并且可以与pandas等其他Python库集成使用。

总之,Seaborn是一个非常实用和强大的数据可视化工具,可以帮助用户更好地理解数据集中的模式和关系,并支持进行深入的数据分析和探索。

代码分享

import pandas as pd
import numpy as np

# 创建示例数据集
data = {
    'species': ['Adelie', 'Chinstrap', 'Gentoo'] * 50,
    'bill_length_mm': np.random.normal(40, 5, 150),
    'bill_depth_mm': np.random.normal(17, 2, 150),
    'flipper_length_mm': np.random.normal(200, 20, 150),
    'body_mass_g': np.random.normal(4000, 500, 150)
}

penguins = pd.DataFrame(data)

# 将species列中的Chinstrap替换为NaN(为了在数据集中创建一些缺失值)
penguins['species'] = penguins['species'].replace('Chinstrap', np.nan)

# 随机选择一些行并添加缺失值以模拟现实数据集
random_rows = np.random.choice(penguins.shape[0], size=10, replace=False)
penguins.loc[random_rows, 'bill_length_mm'] = np.nan
penguins.loc[random_rows, 'bill_depth_mm'] = np.nan
penguins.loc[random_rows, 'flipper_length_mm'] = np.nan
penguins.loc[random_rows, 'body_mass_g'] = np.nan

# 保存数据集到CSV文件
penguins.to_csv('penguins_data.csv', index=False)


import seaborn as sns
import matplotlib.pyplot as plt

# 从CSV文件中加载数据集
penguins = pd.read_csv('penguins_data.csv')

# 绘制散点图矩阵
sns.pairplot(penguins, hue="species", diag_kind="hist")

# 显示图表
plt.show()
import seaborn as sns
import matplotlib.pyplot as plt

# 从CSV文件中加载数据集
penguins = pd.read_csv('penguins_data.csv')

# 绘制小提琴图
sns.violinplot(x='species', y='body_mass_g', data=penguins)

# 显示图表
plt.show()

import seaborn as sns
import matplotlib.pyplot as plt

# 从CSV文件中加载数据集
penguins = pd.read_csv('penguins_data.csv')

# 绘制散点图矩阵
g = sns.pairplot(penguins, diag_kind="kde")
g.map_lower(sns.kdeplot, levels=4, color=".2")

# 显示图表
plt.show()

代码结果

相关推荐

  1. 使用Plotly库绘制嵌入式子图的Python代码

    2024-01-31 13:16:01       33 阅读
  2. 安装 jupyter 运行python代码教程分享

    2024-01-31 13:16:01       33 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-01-31 13:16:01       16 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-01-31 13:16:01       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-01-31 13:16:01       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-01-31 13:16:01       18 阅读

热门阅读

  1. C++ 蓝桥杯历届试题 —— 小苹果题目情景及代码

    2024-01-31 13:16:01       38 阅读
  2. Delphi 析构函数(Destructor)

    2024-01-31 13:16:01       35 阅读
  3. k8s学习-通过Service访问Pod

    2024-01-31 13:16:01       30 阅读
  4. PyCharm常用快捷键和设置

    2024-01-31 13:16:01       33 阅读
  5. Centos 查看版本

    2024-01-31 13:16:01       37 阅读
  6. LeetCode每日一题 | 2670. 找出不同元素数目差数组

    2024-01-31 13:16:01       38 阅读
  7. 《Docker极简教程》--前言--本书的目的和目标

    2024-01-31 13:16:01       41 阅读
  8. 一次Rust重写基础软件的实践(三)

    2024-01-31 13:16:01       24 阅读
  9. SpringBoot实现动态数据源配置

    2024-01-31 13:16:01       33 阅读
  10. 1.29C语言 sscanf函数的用法 abs整数绝对值函数

    2024-01-31 13:16:01       33 阅读
  11. 数据结构-并查集

    2024-01-31 13:16:01       33 阅读
  12. vant滚动条下滑与下拉刷新冲突

    2024-01-31 13:16:01       30 阅读
  13. React 基础学习02

    2024-01-31 13:16:01       31 阅读