一、学习目标
1.了解NumPy数组简单应用。
2.掌握Matplotlib制作折线图、柱形图等。
3.了解pandas进行数据分析使用。
二、相关练习
1、编写程序,建立一维数组a,数组值为array([1,2,3,4]);建立二维数组b,数组值为array(([1,2,3,4],[5,6,7,8])),以此a,b数组为例,进行操作。
import numpy as np
a = np.array([1,2,3,4])#创建一维数组a=np.array([1,2,3,4,5])
b = np.array(([1,2,3,4],[5,6,7,8]))#创建二维数组
#算术运算
print('两数组相乘:')
c = a * b
print(c)
#二维数组转置
print('将数组b转置:')
c = b.T
print(c)
#三角函数运算
print('三角函数运算:')
c = np.sin(b)
print(c)
#四舍五入
print('四舍五入')
print(np.round(np.sin(b)))
#对二维数组不同维度上的元素进行求和
print('b数组的和:',np.sum(b))
print('纵向和:',np.sum(b,axis = 0))
print('横向和:',np.sum(b,axis = 1))
#数组元素访问
print('访问数组b的【1,1】元素:',b[1,1])
#数组与数值的算术运算
print('a * 2 = ',a*2)
#计算标准差
print('数组a标准差为:',np.std(a))
#求二维数组最大值
print('数组b的最大值为:',np.max(b))
#对二维数组进行排序
print('排序:\n',np.sort(b))
2、编写程序,有某电商电脑销售量情况如下表所示:
2020年电脑销售量情况表
月份 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
台式电脑 |
25 |
45 |
30 |
32 |
35 |
100 |
80 |
150 |
125 |
60 |
75 |
80 |
笔记本电脑 |
50 |
110 |
40 |
30 |
45 |
35 |
65 |
250 |
150 |
65 |
90 |
100 |
(中文显示提示:plt.rcParams['font.sans-serif']='SimHei')
请利用Matplotlib制作电脑销售量情况折线图,图形如下所示:
import matplotlib.pyplot as plt#matplotlib
x = [1,2,3,4,5,6,7,8,9,10,11,12]
y1 = [25,45,30,32,35,100,80,150,125,60,75,80]
y2 = [50,110,40,30,45,35,65,250,150,65,90,100]
plt.rcParams['font.sans-serif']='SimHei' #用于中文显示提示
plt.title('2020年电脑销售量情况折线表',fontproperties = 'STKAITI',fontsize = 24)
plt.plot(x,y1,label = '台式电脑')
plt.plot(x,y2,label = '笔记本电脑')
plt.xlabel('月份',fontsize = 18)
plt.ylabel('销售量',fontsize =18)
plt.legend()
plt.show()
3.编写程序,利用上题电脑销售情况表中台式电脑数据,制作如下柱形图。
import matplotlib.pyplot as plt
x = [1,2,3,4,5,6,7,8,9,10,11,12]
y = [25,45,30,32,35,100,80,150,125,60,75,80]
plt.rcParams['font.sans-serif']='SimHei' #用于中文显示提示
plt.title('2020年台式电脑销售量情况柱形图',fontproperties = 'STKAITI',fontsize = 24)
plt.bar(x,y,
color = '#748973', #柱的颜色
alpha = 0.9, #透明度
edgecolor = 'black')
plt.xlabel('月份',fontsize = 15)
plt.ylabel('销售量',fontsize =15)
#为每个柱形添加文本标注
for xx,yy in zip(x,y):
plt.text(xx-0.2,yy+0.1,'%2d'%yy)
#显示图形
plt.show()
4、编写程序,利用如下pandas语句生成3行4列二维数组:
Import numpy as np
Import pandas as pd
pd.DataFrame([np.random.randint(1, 10, 4) for i in range(3)], columns=list('ABCD')),如下所示,按课本17.4节的8种方法进行相关操作。
A B C D
0 5 6 3 7
1 3 7 6 5
2 6 8 8 1
import numpy as np
import pandas as pd
df = pd.DataFrame([np.random.randint(1, 10, 4) for i in range(3)], columns=list('ABCD'))
print('查看所创建的二维数据:\n',df.head())
print('查看二维数据的索引、列名')
print('索引:',df.index)
print('列名:',df.columns)
print('查看二维数组数据的统计信息',df.describe())
print('对二维数组进行排序操作:\n')
print(df.sort_index(axis=0,ascending = False))#对索引进行降序排序
print('二维数组数据的选择与访问:')
print('选择某一列数据:\n',df['A'])
print('使用切片操作:\n')
print(df[0:2])
print('查询某行数据:')
print(df.iloc[1])
三、练习总结
- 在这次练习中,通过import numpy这个模块进来,创建一维数组和二维数组,并了解和运用了其基本操作。
- 并运用Matplotlib去制作折线图、柱形图,掌握了制作折线图、柱形图的制作方法。
- 了解了利用pandas 创建数据,以及各种操作。