python爬虫(7)之pandas模块

1、pandas模块里的两个对象

1、Series 对象

series很类似于一维数组但是它相较于数组多了行标签

示例代码:

import pandas as pd

ac =pd.Series([[1,2,8,9],[3,5,5,8]])

print(ac)

结果如下:

当然也可以更改行标签

示例如下:

import pandas as pd

ac =pd.Series([[1,2,8,9],[3,5,5,8]],index = ['a1','a2'])

print(ac)

结果如下:

当然也可以像是字典那样去创建Series对象,其中字典的键对应行标签

代码如下:

import pandas as pd

ac =pd.Series({'a1':'[1,2,8,9]','a2':'[3,5,5,8]'})

print(ac)

结果如下:

2、DataFrame对象

DataFrame 对象比前面所提到的Series对象用途更加宽泛,所以说后面尽量都来使用DataFrame来展开

代码示例:

import pandas as pd

i = pd.DataFrame([['数学',98],['语文',57]],columns=['学科','成绩'],index = ['a1','a2'])

print(i)

其中columns表示列标签 index表示行标签

结果如下:

2、读取Excel数据

1、读取工作表的数据

pd.read_excel()

代码示例如下:

import pandas as pd

import matplotlib.pyplot  as plt

data_1 = pd.read_excel('E:\desktop\橙仙的仙子梦想\附件2.xlsx', sheet_name=0)

plt.rcParams['font.sans-serif'] = ['SimHei']  

plt.rcParams['axes.unicode_minus'] = False

plt.rcParams['font.sans-serif'] = ['SimHei']

plt.rcParams['axes.unicode_minus'] = False

data_2 = data_1[data_1['是否打折销售'] =='否']

data_3 = data_2.shape

data_4  =data_1[data_1['是否打折销售'] =='是']

data_5 = data_4.shape

x = [ '不打折','打折']

y = [data_3[0],data_5[0]]

plt.bar(x,y,width= 0.1,color = 'pink' )

plt.title(label= "打折",loc= 'center')

plt.show()

结果如下:

注意:要将我得目录链接进行更改,明确自己的表的位置,使用相对路径,明确自己电脑的字体设置,要不然会报错。

2、指定读取数据的列标签和行标签

data_1 = pd.read_excel('E:\desktop\橙仙的仙子梦想\附件2.xlsx', sheet_name=0,header=0)

data_1 = pd.read_excel('E:\desktop\橙仙的仙子梦想\附件2.xlsx', sheet_name=0,index_col = 1)

其中header表示列标签(从零开始,这里若为None则会将列标签设置为从零开始)从某列开始读,index_col 表示行标签(也是从零开始)从某行开始读


 

相关推荐

  1. Python爬虫BeautifulSoup模块

    2024-03-17 05:04:07       36 阅读
  2. python爬虫(11)BeautifulSoup模块

    2024-03-17 05:04:07       40 阅读
  3. PythonPandas详解

    2024-03-17 05:04:07       29 阅读
  4. Python爬虫-request模块

    2024-03-17 05:04:07       32 阅读
  5. Python爬虫-requests模块

    2024-03-17 05:04:07       28 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-03-17 05:04:07       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-03-17 05:04:07       100 阅读
  3. 在Django里面运行非项目文件

    2024-03-17 05:04:07       82 阅读
  4. Python语言-面向对象

    2024-03-17 05:04:07       91 阅读

热门阅读

  1. 行走的机器人

    2024-03-17 05:04:07       39 阅读
  2. linux 查看日志包含***字符上下200行日志命令

    2024-03-17 05:04:07       44 阅读
  3. wsl-oraclelinux 固定ip

    2024-03-17 05:04:07       47 阅读
  4. 2024计算机二级6

    2024-03-17 05:04:07       42 阅读
  5. Invalid value type for attribute ‘factoryBeanObjectType‘

    2024-03-17 05:04:07       37 阅读
  6. 189: 素数判定(python)

    2024-03-17 05:04:07       39 阅读
  7. 2024.2.20 校招 实习 内推 面经

    2024-03-17 05:04:07       40 阅读
  8. HashMap常用方法

    2024-03-17 05:04:07       45 阅读
  9. C语言自学笔记19----结构体函数

    2024-03-17 05:04:07       41 阅读
  10. 实现快速排序所踩的坑

    2024-03-17 05:04:07       40 阅读
  11. P8706 [蓝桥杯 2020 省 AB1] 解码 Python

    2024-03-17 05:04:07       38 阅读