Python使用pandas库,其中的DataFrame可以看作是一个二维的、大小可变的、有潜在异构类型列的表格型数据结构

Python的pandas库是一个非常强大的数据处理工具,其中的DataFrame对象更是其核心组件。DataFrame可以看作是一个二维的、大小可变的、有潜在异构类型列的表格型数据结构。你可以把它想象成一个Excel表格,有行有列,可以存储各种类型的数据。

下面是一些常见的pandas DataFrame对象处理操作:

1. 创建DataFrame

python
复制
import pandas as pd

# 使用字典创建DataFrame
data = {'Name': ['Tom', 'Nick', 'John'], 'Age': [20, 21, 19]}
df = pd.DataFrame(data)

# 打印DataFrame
print(df)


2. 查看DataFrame的基本信息

python
复制
# 查看前几行数据
print(df.head())

# 查看后几行数据
print(df.tail())

# 查看数据的基本信息,包括每列的非空值数量、类型等
print(df.info())

# 查看数据的摘要统计
print(df.describe())


3. 选择数据

python
复制
# 选择单列
print(df['Name'])

# 选择多列
print(df[['Name', 'Age']])

# 使用iloc根据整数位置选择行和列
print(df.iloc[0:2, 0:1])  # 选择前两行,第一列

# 使用loc根据标签选择行和列
print(df.loc[0:2, 'Name'])  # 选择前两行,'Name'列


4. 数据清洗

python
复制
# 删除含有缺失值的行
df_dropna = df.dropna()

# 填充缺失值
df_fillna = df.fillna(method='ffill')  # 前向填充


5. 数据排序

python
复制
# 按照某列进行排序
df_sorted = df.sort_values(by='Age')


6. 数据分组和聚合

python
复制
# 按照某列进行分组,并对另一列进行聚合操作(如求和)
df_grouped = df.groupby('Name')['Age'].sum()


7. 数据合并

python
复制
# 创建另一个DataFrame
df2 = pd.DataFrame({'Name': ['Tom', 'Jerry'], 'Score': [90, 85]})

# 按照'Name'列进行合并
df_merged = pd.merge(df, df2, on='Name')


这些只是pandas DataFrame对象处理的一些基本操作,pandas库的功能远不止于此。如果你需要处理更复杂的数据,建议查阅pandas的官方文档或相关教程。

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-06 14:46:01       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-06 14:46:01       100 阅读
  3. 在Django里面运行非项目文件

    2024-04-06 14:46:01       82 阅读
  4. Python语言-面向对象

    2024-04-06 14:46:01       91 阅读

热门阅读

  1. 人脸识别的经典深度学习方法

    2024-04-06 14:46:01       38 阅读
  2. xv6源码分析 001

    2024-04-06 14:46:01       39 阅读
  3. Python编程-使用logging管理程序日志

    2024-04-06 14:46:01       33 阅读
  4. 如何DEBUG ABAP程序中的循环语句

    2024-04-06 14:46:01       37 阅读
  5. 【数据结构】串

    2024-04-06 14:46:01       37 阅读
  6. 达梦体系结构:进程架构

    2024-04-06 14:46:01       30 阅读