[python]bar_chart_race绘制动态条形图

最近在 B 站上看到了一个宝藏 up 主,名叫 "Jannchie见齐",专门做动态条形图相关的数据可视化。

可以看到做出的效果还是很不错的,但工具使用的是 JS,不是 Python,于是尝试搜索了一下,看看 Python 有没有相关的库能够做出动态条形图相关的效果。幸运的是还真有相关的库,叫 bar_chart_race,那么下面就来看看相关的用法。

老规矩,使用之前先安装,直接 pip install bar-chart-race 即可。

使用方法

下面来看看使用方法。

import pandas as pd
import bar_chart_race as bcr

# 如果出现SSL错误,则全局取消证书验证
# import ssl
# ssl._create_default_https_context = ssl._create_unverified_context

# 获取数据
df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
# 生成 GIF 图像
bcr.bar_chart_race(df, "covid19_horiz.gif")

我们看到代码非常简单,就是将数据转成 pandas 的 DataFrame,然后调用 bar_chart_race 即可生成 GIF 图像。

整体还是不错的,然后我们重点来看一下数据:

其中表头就是 GIF 图表中 Y 轴的部分,但需要注意的是,我们的图表是随时间不断变化的,所以我们在生成 DataFrame 的时候必须将 date 字段设置为索引。然后数据随着时间不断变化,并且条形图之间会根据数据的大小进行排序。

当然了,以上只是默认生成的,bar_chart_race 里面还有很多的参数,我们来看一下。

动态条形图变动态柱状图
import pandas as pd
import bar_chart_race as bcr

df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
bcr.bar_chart_race(df, "covid19_horiz.gif", orientation='v')

我们看到为了避免文字发生重叠,自动倾斜了,所以还是比较人性化的。

排序方式,默认为降序
import pandas as pd
import bar_chart_race as bcr

df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
# 设置排序方式
bcr.bar_chart_race(df, "covid19_horiz.gif", sort='asc')

条目数限制
import pandas as pd
import bar_chart_race as bcr

df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
# 设置最多能显示的条目数,这里最多显示 6 条
bcr.bar_chart_race(df, 'covid19_horiz.gif', n_bars=6)

设置固定类目
import pandas as pd
import bar_chart_race as bcr

df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
# 选取如下 5 个国家的数据
bcr.bar_chart_race(df, 'covid19_horiz.gif', fixed_order=['Iran', 'USA', 'Italy', 'Spain', 'Belgium'])

固定数值轴,使其不发生动态变化
import pandas as pd
import bar_chart_race as bcr

df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
# 设置数值的最大值,固定数值轴
bcr.bar_chart_race(df, 'covid19_horiz.gif', fixed_max=True)

设置图像帧数,默认 10 帧
import pandas as pd
import bar_chart_race as bcr

df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
# 图像帧数:数值越小,越不流畅;越大,越流畅
bcr.bar_chart_race(df, 'covid19_horiz.gif', steps_per_period=3)

可以看到,动图变得不流畅了。

设置帧率,单位时间默认为 500ms
import pandas as pd
import bar_chart_race as bcr

df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
# 设置帧率为 200ms,总共 20 帧
bcr.bar_chart_race(df, 'covid19_horiz.gif', steps_per_period=20, period_length=200)

设置每帧增加的标签时间,默认为 False
import pandas as pd
import bar_chart_race as bcr

df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
bcr.bar_chart_race(df, 'covid19_horiz.gif', interpolate_period=True)

绘图属性设置
import pandas as pd
import bar_chart_race as bcr

df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
# figsize:设置画布大小,默认 (6, 3.5)
# dpi:图像分辨率,默认 144
# label_bars:显示柱状图的数值信息,默认为 True;指定为 False 则不显示;指定为字典,则自定义显示属性
# period_label:显示时间标签信息,默认为 True;指定为 False 则不显示;指定为字典,则自定义显示属性
# period_fmt:设置日期格式
# title:图表标题
# title_size:标题字体大小
# shared_fontdict:全局字体属性,例如 {'family': 'Helvetica', 'weight': 'bold', 'color': 'rebeccapurple'}
bcr.bar_chart_race(df, 'covid19_horiz.gif', figsize=(5, 3), dpi=100, label_bars=False,
                   period_label={'x': .99, 'y': .1, 'ha': 'right', 'color': 'red'},
                   title='COVID-19 Deaths by Country')

条形图属性,可以设置透明度,边框等
import pandas as pd
import bar_chart_race as bcr

df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
# bar_kwargs:条形图属性
bcr.bar_chart_race(df, 'covid19_horiz.gif', bar_kwargs={'alpha': .2, 'ec': 'black', 'lw': 3})

添加动态文本
import pandas as pd
import bar_chart_race as bcr
import matplotlib.pyplot as plt

# 设置字体,否则无法显示中文
plt.rcParams['font.sans-serif'] = ['SimHei']  # Windows
# plt.rcParams['font.sans-serif'] = ['Hiragino Sans GB'] # Mac
plt.rcParams['axes.unicode_minus'] = False

df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])

def summary(values, ranks):
    # 动态文本的内容
    """
    values 为 df 的每一行(Series),例如
        Belgium            1143.0
        China              3326.0
        France             6520.0
        Germany            1275.0
        Iran               3294.0
        Italy             14681.0
        Netherlands        1490.0
        Spain             11198.0
        USA                7418.0
        United Kingdom     3611.0
        Name: 2020-04-03, dtype: float64

    ranks 则是针对 values 的值进行了排名,例如
        Belgium            1.0
        China              5.0
        France             7.0
        Germany            2.0
        Iran               4.0
        Italy             10.0
        Netherlands        3.0
        Spain              9.0
        USA                8.0
        United Kingdom     6.0
        Name: 2020-04-03, dtype: float64
    """
    all_people = int(values.sum())
    ranks_country = ranks.sort_values().index
    s = f'总死亡人数:{all_people},死亡人数最多的国家:{ranks_country[-1]},死亡人数最少的国家:{ranks_country[0]}'
    # 设置文本位置、数值、大小、颜色等
    return {'x': .99, 'y': .05, 's': s, 'ha': 'right', 'size': 8}
# 添加文本
bcr.bar_chart_race(df, 'covid19_horiz.gif', period_summary_func=summary)

添加垂直条
import pandas as pd
import bar_chart_race as bcr

df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
# 设置垂直条数值,分位数
def func(values, ranks):
    return values.quantile(.9)
# 添加垂直条
bcr.bar_chart_race(df, 'covid19_horiz.gif', perpendicular_bar_func=func)

设置柱状图颜色
import pandas as pd
import bar_chart_race as bcr

df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
bcr.bar_chart_race(df, 'covid19_horiz.gif', cmap="plotly3")

那么颜色都有哪些呢?

from pprint import pprint
from bar_chart_race._colormaps import colormaps
pprint(list(colormaps.keys()))
"""
['dark12',
 'dark12_r',
 'plotly3',
 'viridis',
 'cividis',
 'inferno',
 'magma',
 'plasma',
 'blackbody',
 'bluered',
 'electric',
 ....
 ....
"""

柱状图颜色不重复
import pandas as pd
import bar_chart_race as bcr

df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
bcr.bar_chart_race(df, 'covid19_horiz.gif', cmap="plotly3", filter_column_colors=True)

以上就是绝大部分配置,当然源码中注释写的也比较详细,可以点进去看一下。

相关推荐

  1. R 绘图 - 条形

    2024-03-22 09:32:01       30 阅读
  2. 使用Python绘制百分比堆积条形

    2024-03-22 09:32:01       27 阅读
  3. 绘制动态心形的MATLAB代码

    2024-03-22 09:32:01       75 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-03-22 09:32:01       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-03-22 09:32:01       100 阅读
  3. 在Django里面运行非项目文件

    2024-03-22 09:32:01       82 阅读
  4. Python语言-面向对象

    2024-03-22 09:32:01       91 阅读

热门阅读

  1. 构建Pytorch虚拟环境教程

    2024-03-22 09:32:01       42 阅读
  2. ROS git使用

    2024-03-22 09:32:01       32 阅读
  3. RHCE 第二章 时间服务器

    2024-03-22 09:32:01       43 阅读
  4. docker基础(五)之docker run(第二弹)

    2024-03-22 09:32:01       42 阅读
  5. P1005 [NOIP2007 提高组] 矩阵取数游戏

    2024-03-22 09:32:01       40 阅读
  6. Ubuntu---之用户管理

    2024-03-22 09:32:01       43 阅读
  7. 在ubuntu22.04.4安装freeswitch1.10.10

    2024-03-22 09:32:01       42 阅读
  8. Lombok-@Singular 和 @Builder 组合

    2024-03-22 09:32:01       39 阅读