Python数据分析与可视化笔记 二 机器学习与数据分析的关系 数据分析的基本步骤 Python和数据分析

机器学习与数据分析的关系

        机器学习一开始研究的目的是让机器具有学习能力从而拥有智能。目前公认的定义是:利用经验来改善计算机系统自身的性能。由于经验在计算机系统中主要以数据形式存在,因此机器学习需要对数据进行分析。

        数据分析的定义则是:识别出巨量数据中有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程,即从海量数据中找到有用的知识

数据分析的基本步骤

        数据分析的基本步骤包括:数据收集-->数据预处理-->数据分析与知识发现-->数据后处理

(1)数据收集

        以前的数据收集会有以下一些步骤:抽样、测量、编码、输入、核对。这是一种主动的数据收集方法。

        但现有状况是,传感器、照相机等电子设备的普及导致大量的数据涌入,无法像传统的数据收集那样得到少而精的数据,而是大量的、冗余的、体量大且信息量少的数据。从这样的数据中得到所需要的信息的过程是目前数据分析的难点和重点。

(2)数据预处理

数据预处理过程是完成数据到信息的过程。包括:首先对数据进行初步统计方面的分析,得到数据的基本档案;其次分析数据质量,从数据的一致性、完整性、准确性以及及时性四个方面分析;接着根据发现的数据质量问题对数据进行清洗,包括缺失值处理、噪声处理等;最后对其进行特征提取,为后续的数据分析工作做准备。

(3)数据分析与知识发现 

数据分析与知识发现是将预处理后的数据进行进一步的分析,完成信息到认识的过程。主要分为有监督的分析无监督的分析。有监督的分析包括分类分析、关联分析和回归分析;无监督的分析包括聚类分析、异常检测

(4)数据后处理

主要包括提供数据给决策支撑系统、数据可视化等。

Python和数据分析

Python有三个优点:面向生产、强大的第三方库支持、胶水语言

相关推荐

  1. Python数据分析笔记关联

    2024-03-19 16:58:02       31 阅读
  2. python数据分析

    2024-03-19 16:58:02       42 阅读
  3. 机器学习基础实验(Python 数据分析

    2024-03-19 16:58:02       56 阅读
  4. Python数据分析笔记机器学习概述

    2024-03-19 16:58:02       40 阅读
  5. Python高级编程:数据分析数据

    2024-03-19 16:58:02       29 阅读
  6. Python常用数据分析

    2024-03-19 16:58:02       22 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-03-19 16:58:02       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-03-19 16:58:02       101 阅读
  3. 在Django里面运行非项目文件

    2024-03-19 16:58:02       82 阅读
  4. Python语言-面向对象

    2024-03-19 16:58:02       91 阅读

热门阅读

  1. 01.Linked-List-Sort

    2024-03-19 16:58:02       34 阅读
  2. leetcode 9. 回文数

    2024-03-19 16:58:02       42 阅读
  3. Mybatis Plus代码生成code

    2024-03-19 16:58:02       45 阅读
  4. 关于服务器被入侵的个人日志(┬┬﹏┬┬)

    2024-03-19 16:58:02       43 阅读
  5. centos 7 添加启动脚本

    2024-03-19 16:58:02       37 阅读
  6. MySQL实战45讲

    2024-03-19 16:58:02       36 阅读
  7. 蓝桥杯算法基础(25)边长为1的最大子方阵优化

    2024-03-19 16:58:02       39 阅读