【持更】python数据处理-学习笔记

1、读取excel /csv及指定sheet:

pd.read_excel=("路径",sheetname="xx")

修改列名df.rename

修改字符串类型到数字 pandas.to_numeric()

2、删除drop、去重drop_duplicates

(1)空值所在行/列

行:df.dropna(axis=0, how='any', inplace=True)

列:df.dropna(axis=1, how='any', inplace=True)

(2)删除指定列为空的行

df = df.dropna(subset=['列名')

(3)删除指定行/列

df=df.drop(['列名'],axis=1) ;df=df.drop(cloumns=['列名'])

(4)去重

df=df.drop_duplicates(subset=['列名1','列名2'],keep=‘’,inplace=xx)

3、新增一列/行

(1)在最后新增一列固定值 df['列名']='值'

4、新建一个表,另存为

保存到csv就 dataframe.to_csv() ;保存到excel就dataframe.to_excel()

writer=pd.excelwriter('路径')

df.to_excel(writer)

writer.save()

writer.close()

自定义函数

操作行/列 apply

列之间的加减乘除 df["列名"].apply(lambda x:x["a"]+x["b"],axis=1)

指定列求和汇总:xx = df['列名'].sum()

5、纵向匹配 拼接 merge

6、分组汇总+使用函数 group by

分组:df.groupby(['列名'])

分组计数:df.groupby(['列名']).count()

分组求和:df.groupby(['列名']).sum()['列名']

相关推荐

  1. python数据处理-学习笔记

    2023-12-16 20:42:04       49 阅读
  2. python-学习笔记:异常处理

    2023-12-16 20:42:04       52 阅读
  3. Python 学习笔记(十一)—— 异常处理

    2023-12-16 20:42:04       38 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2023-12-16 20:42:04       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2023-12-16 20:42:04       100 阅读
  3. 在Django里面运行非项目文件

    2023-12-16 20:42:04       82 阅读
  4. Python语言-面向对象

    2023-12-16 20:42:04       91 阅读

热门阅读

  1. 51单片机c语言烧录软件,51单片机烧写程序的方法

    2023-12-16 20:42:04       56 阅读
  2. redis基本用法学习(主要数据类型)

    2023-12-16 20:42:04       54 阅读
  3. 第23节: Vue3 绑定 HTML 类

    2023-12-16 20:42:04       60 阅读
  4. Spring Boot核心原理

    2023-12-16 20:42:04       62 阅读
  5. linux/CentOS 7安装Nginx

    2023-12-16 20:42:04       55 阅读
  6. 异常处理与CrashRpt工具——(2)

    2023-12-16 20:42:04       53 阅读
  7. 单页应用如何提高加载速度?

    2023-12-16 20:42:04       60 阅读
  8. C++ 字符串类 简易封装

    2023-12-16 20:42:04       42 阅读
  9. Linux系统架构和命令

    2023-12-16 20:42:04       46 阅读
  10. 如何在PHP中使用Memcached和Redis?

    2023-12-16 20:42:04       52 阅读