Python使用pandas库，其中的DataFrame可以看作是一个二维的、大小可变的、有潜在异构类型列的表格型数据结构

2024-04-06 14:46:01
开发
43

Python的pandas库是一个非常强大的数据处理工具，其中的DataFrame对象更是其核心组件。DataFrame可以看作是一个二维的、大小可变的、有潜在异构类型列的表格型数据结构。你可以把它想象成一个Excel表格，有行有列，可以存储各种类型的数据。

下面是一些常见的pandas DataFrame对象处理操作：

1. 创建DataFrame

python
复制
import pandas as pd

# 使用字典创建DataFrame
data = {'Name': ['Tom', 'Nick', 'John'], 'Age': [20, 21, 19]}
df = pd.DataFrame(data)

# 打印DataFrame
print(df)

2. 查看DataFrame的基本信息

python
复制
# 查看前几行数据
print(df.head())

# 查看后几行数据
print(df.tail())

# 查看数据的基本信息，包括每列的非空值数量、类型等
print(df.info())

# 查看数据的摘要统计
print(df.describe())

3. 选择数据

python
复制
# 选择单列
print(df['Name'])

# 选择多列
print(df[['Name', 'Age']])

# 使用iloc根据整数位置选择行和列
print(df.iloc[0:2, 0:1]) # 选择前两行，第一列

# 使用loc根据标签选择行和列
print(df.loc[0:2, 'Name']) # 选择前两行，'Name'列

4. 数据清洗

python
复制
# 删除含有缺失值的行
df_dropna = df.dropna()

# 填充缺失值
df_fillna = df.fillna(method='ffill') # 前向填充

5. 数据排序

python
复制
# 按照某列进行排序
df_sorted = df.sort_values(by='Age')

6. 数据分组和聚合

python
复制
# 按照某列进行分组，并对另一列进行聚合操作（如求和）
df_grouped = df.groupby('Name')['Age'].sum()

7. 数据合并

python
复制
# 创建另一个DataFrame
df2 = pd.DataFrame({'Name': ['Tom', 'Jerry'], 'Score': [90, 85]})

# 按照'Name'列进行合并
df_merged = pd.merge(df, df2, on='Name')

这些只是pandas DataFrame对象处理的一些基本操作，pandas库的功能远不止于此。如果你需要处理更复杂的数据，建议查阅pandas的官方文档或相关教程。

原文地址:https://blog.csdn.net/shixuegen/article/details/137242510 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1776501596545486848.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

最近更新

题解 - 序列

2024-04-06 14:46:01 116 阅读
CST热仿真案例——电动车直流快充Cable热仿真

2024-04-06 14:46:01 102 阅读
docker php8.1+nginx base 镜像 dockerfile 配置

2024-04-06 14:46:01 94 阅读
Could not load dynamic library ‘cudart64_100.dll‘

2024-04-06 14:46:01 100 阅读
NoSQL之Redis非关系型数据库

2024-04-06 14:46:01 101 阅读
2024.7.22 作业

2024-04-06 14:46:01 96 阅读
GDB调试正在运行的程序

2024-04-06 14:46:01 81 阅读
昇思25天学习打卡营第18天| DCGAN生成漫画头像

2024-04-06 14:46:01 85 阅读
在Django里面运行非项目文件

2024-04-06 14:46:01 82 阅读
SSD基本架构与工作原理

2024-04-06 14:46:01 87 阅读
在誉天学习完HCIE就业吗？

2024-04-06 14:46:01 93 阅读
【合同专题】合同终止协议书、项目合作协议、交底纪要、管理台账

2024-04-06 14:46:01 84 阅读
驾驭云原生日志洪流：高效分析与管理的策略集

2024-04-06 14:46:01 85 阅读
go 协程池的实现

2024-04-06 14:46:01 88 阅读
Shell脚本循环语句与函数

2024-04-06 14:46:01 89 阅读
连锁店收银系统源码（收银称重pos+聚合支付+ERP进销存+营销+会员管理）

2024-04-06 14:46:01 93 阅读
TIA博途V19无法勾选来自远程对象的PUT/GET访问的解决办法

2024-04-06 14:46:01 85 阅读
四大引用——强软弱虚

2024-04-06 14:46:01 86 阅读
Python语言-面向对象

2024-04-06 14:46:01 91 阅读
如何分清楚常见的 Git 分支管理策略Git Flow、GitHub Flow 和 GitLab Flow

2024-04-06 14:46:01 85 阅读
网站安全-CDN篇

2024-04-06 14:46:01 88 阅读

热门阅读

SV学习笔记（一）

2024-04-06 14:46:01 29 阅读
【C++】二叉搜索数

2024-04-06 14:46:01 42 阅读
备考ICA----Istio实验15---开启 mTLS 自动双向认证实验

2024-04-06 14:46:01 35 阅读
人脸识别的经典深度学习方法

2024-04-06 14:46:01 38 阅读
4.5日学习打卡----学习Apache HttpClient 5

2024-04-06 14:46:01 34 阅读
diffusion model(十五) : IP-Adapter技术小结

2024-04-06 14:46:01 35 阅读
python 利用xpath 爬取一周天气

2024-04-06 14:46:01 39 阅读
web组态软件（BY组态）介绍

2024-04-06 14:46:01 39 阅读
xv6源码分析 001

2024-04-06 14:46:01 39 阅读
Github 2024-04-06Rust开源项目日报Top10

2024-04-06 14:46:01 38 阅读
【打印SQL执行日志】⭐️Mybatis-Plus通过配置在控制台打印执行日志

2024-04-06 14:46:01 38 阅读
file_get_contents(‘php://input‘)；这个postman要如何传参

2024-04-06 14:46:01 39 阅读
CCIE-10-IPv6-TS

2024-04-06 14:46:01 32 阅读
考研回忆录【二本-＞211】

2024-04-06 14:46:01 38 阅读
Python编程-使用logging管理程序日志

2024-04-06 14:46:01 33 阅读
【stm32】I2C通信协议

2024-04-06 14:46:01 36 阅读
ARM FVP平台的terminal窗口大小如何设置

2024-04-06 14:46:01 37 阅读
milvus-2.3.12安装部署

2024-04-06 14:46:01 36 阅读
C++——特殊类设计

2024-04-06 14:46:01 41 阅读
如何DEBUG ABAP程序中的循环语句

2024-04-06 14:46:01 37 阅读
第三章学习

2024-04-06 14:46:01 38 阅读
MAX7219驱动数码管学习记录（有源码）

2024-04-06 14:46:01 40 阅读
视觉SLAM学习打卡【7-1】-视觉里程计·特征点法

2024-04-06 14:46:01 33 阅读
36.3k star, 免费开源现代化、响应式 HTML 模板 tabler

2024-04-06 14:46:01 32 阅读
Francek Chen 的128天创作纪念日

2024-04-06 14:46:01 37 阅读
【sqlite3】网络socket编程温度采集智能存储与上报项目技术------sqlite3数据库基础

2024-04-06 14:46:01 31 阅读
【数据结构】串

2024-04-06 14:46:01 37 阅读
《截流猎客系统》第1节：截流猎客运营诊断技术，确定营销战法

2024-04-06 14:46:01 209 阅读
【Linux】make 工具和 Makefile 文件的引入

2024-04-06 14:46:01 35 阅读
达梦体系结构：进程架构

2024-04-06 14:46:01 30 阅读