机器学习 | 机器学习基础知识

 

一、机器学习是什么

 

        计算机从数据中学习规律并改善自身进行预测的过程。

 


 

二、数据集

 

1、最常用的公开数据集

2、结构化数据与非结构化数据

 


 

三、任务地图

 

 

1、分类任务 Classification

 

  • 已知样本特征
  • 判断样本类别
  • 二分类、多分类、多标签分类

        二分类:垃圾邮件分类、图像识别等

                

        多分类问题:鸢尾花分类问题

        多标签分类问题:标签间不互斥,概率和不为1        

        

 

2、回归任务 Regression

  • 线性回归
  • 多项式回归:一个因变量,一个或多个自变量。
  • 任何函数都可以用多项式逼近。
  • 逻辑回归:实际是分类,简单可并行,细节很多
    • 类似二分类,但求法不同

 


 

 三、机器学习的分类

 

 

 根据有没有老师 ~

 

1、监督学习 Supervised Learning

        分类和回归

        训练数据有标记

 

2、无监督学习 Unsupervised Learning

         训练数据未经标记

        聚类 —— K均值算法 K-means、密度聚类 DBSCAN、最大期望算法

        降维 —— 主成分分析 PCA、核方法

        关联规则学习 —— 挖掘特征间关联关系,Apriori方法、Eclat方法

                

 

3、半监督学习 Semi-supervised Learning

         少量标记学习,大量无标记数据

 

4、强化学习 Reinforcement Learning

        观测环境、估计状态、执行操作、获得回报或惩罚

 


 

 根据数据怎么用 ~

 

1、 批量学习 (Batch Learning)

        先训练再使用
        需要大量的时间和计算资源
        通常都是离线完成

 

2、在线学习

         

 


 

  根据模型怎么扩展 ~

 

1、基于实例的学习

        先记住训练实例,相似度计算

 

2、基于模型的学习

        先构建模型

 

相关推荐

  1. 机器学习基础入门

    2023-12-15 08:38:02       55 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2023-12-15 08:38:02       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2023-12-15 08:38:02       100 阅读
  3. 在Django里面运行非项目文件

    2023-12-15 08:38:02       82 阅读
  4. Python语言-面向对象

    2023-12-15 08:38:02       91 阅读

热门阅读

  1. Redis篇

    Redis篇

    2023-12-15 08:38:02      52 阅读
  2. Mistral AI 为什么这么火

    2023-12-15 08:38:02       55 阅读
  3. 网络安全渗透测试的相关理论和工具

    2023-12-15 08:38:02       44 阅读
  4. 向量、矩阵、数组、向量空间

    2023-12-15 08:38:02       62 阅读
  5. C#调用zlib1.dll错误排查

    2023-12-15 08:38:02       46 阅读
  6. 二叉树中的中序遍历、反向遍历和逆序

    2023-12-15 08:38:02       54 阅读
  7. Leetcode -2

    2023-12-15 08:38:02       52 阅读
  8. 项目中使用临时文件夹或获取文件资源路径

    2023-12-15 08:38:02       62 阅读