用pandas实现用前一行的excel的值填充后一行

今天接到一份数据需要分析,数据在一个excel文件里,内容大概形式如下:

后面空的格子里的值就是默认是前面的非空的值,由于数据分析的需要需要对重复的数据进行去重,去重就需要把控的cell的值补上,然后根据几个关键的cell的值计算一个唯一的key, 类似如下:

如果UniqueKey有重复的,就可以通过Excel的去重复数据的功能,直接将重复的行去掉。

接下来就需要一个简单的方法,把后面的空的cell的内容填上,这样通过公式计算UniqueKey时,就可以很容易。虽然Excel也提供了可以使用其他的Cell的值填充空白Cell的值,但是操作步骤有点作,而且对于操作有几千上万行的excel文件来说,太不方便,万一出错,就需要重来一遍。

正好学习了pandas库,发现用它的dataframe可以很轻松地实现。

Python代码如下:

import pandas as pd

data_file = "F:\\1.xlsx"
data_info = pd.read_excel(data_file)
data_info.fillna(method="ffill", inplace=True)
data_info.to_excel("2.xlsx")

代码运行之后,打开输出文件,内容如下:

几行代码就可以轻松搞定几万行的文件的数据处理!

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-01-19 15:56:01       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-01-19 15:56:01       106 阅读
  3. 在Django里面运行非项目文件

    2024-01-19 15:56:01       87 阅读
  4. Python语言-面向对象

    2024-01-19 15:56:01       96 阅读

热门阅读

  1. mysql 自动生成随机数

    2024-01-19 15:56:01       60 阅读
  2. Mysql 报错Parameter ‘@xxx‘ must be defined

    2024-01-19 15:56:01       52 阅读
  3. Echarts 图表自适应

    2024-01-19 15:56:01       51 阅读
  4. User表设计

    2024-01-19 15:56:01       50 阅读
  5. 算法-排序

    2024-01-19 15:56:01       43 阅读
  6. Mysql旧数据处理常用sql模板·持续更新...

    2024-01-19 15:56:01       52 阅读
  7. 中文论文写作过程中的-GPT命令----未完待续

    2024-01-19 15:56:01       54 阅读
  8. 生成指定位数的编号,不够的在左边补0

    2024-01-19 15:56:01       50 阅读
  9. 如何学习一些需要算法的程序

    2024-01-19 15:56:01       55 阅读
  10. Js面试之防抖与节流

    2024-01-19 15:56:01       51 阅读
  11. 前端实现汉堡菜单

    2024-01-19 15:56:01       53 阅读
  12. 编写递归算法,计算二叉树T中叶子结点的数目。

    2024-01-19 15:56:01       50 阅读