数据分析基础之《pandas(6)—高级处理》

一、缺失值处理

1、如何处理nan
两种思路:
(1)如果样本量很大,可以删除含有缺失值的样本
(2)如果要珍惜每一个样本,可以替换/插补(计算平均值或中位数)

2、判断数据是否为nan
pd.isnull(df)
pd.notnull(df)

3、缺失值处理方式
存在缺失值nan,并且是np.nan
(1)dropna(axis='rows')
删除存在缺失值

(2)fillna(value, inplace=True)
替换缺失值
说明:
value:替换成的值
inplace:
    True:会修改原数据
    False:不替换修改原数据,生成新的对象

(3)缺失值不是nan,是其他标记的
后面再说

二、缺失值处理实例

1、电影数据文件获取

相关推荐

  1. 数据分析基础pandas6)—高级处理

    2024-02-08 12:58:01       32 阅读
  2. 数据分析Pandas 数据处理

    2024-02-08 12:58:01       30 阅读
  3. python的pandas数据分析处理基础学习

    2024-02-08 12:58:01       39 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-02-08 12:58:01       17 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-02-08 12:58:01       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-02-08 12:58:01       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-02-08 12:58:01       18 阅读

热门阅读

  1. 【原创】MQTT开发笔记(四)- 压力测试

    2024-02-08 12:58:01       33 阅读
  2. Why React Doesn‘t Need jQuery?

    2024-02-08 12:58:01       30 阅读
  3. HTML5

    HTML5

    2024-02-08 12:58:01      29 阅读
  4. 自然语言NLP

    2024-02-08 12:58:01       30 阅读
  5. LiveData 迁移到 Kotlin Flow详解

    2024-02-08 12:58:01       36 阅读
  6. 【Kotlin】Kotlin基本数据类型

    2024-02-08 12:58:01       20 阅读
  7. Rust 初体验2

    2024-02-08 12:58:01       23 阅读
  8. linux 密码管理

    2024-02-08 12:58:01       31 阅读
  9. nginx stream proxy 模块的ssl连接源码分析

    2024-02-08 12:58:01       28 阅读
  10. c++学习:climits头文件使用

    2024-02-08 12:58:01       32 阅读
  11. 【服务器部署】Docker环境的安装

    2024-02-08 12:58:01       29 阅读
  12. Redis面试题45

    2024-02-08 12:58:01       32 阅读
  13. C#实现 Windows 11 快捷键切换声音输出设备

    2024-02-08 12:58:01       28 阅读
  14. 锐捷设备常用命令

    2024-02-08 12:58:01       69 阅读
  15. 等差数列_1878_C. Vasilije in Cacak

    2024-02-08 12:58:01       36 阅读