机器学习入门

2024-01-22 11:14:07
开发
52

让机器去学习
让机器去执行
最早的机器学习应用-垃圾邮件分辨
传统的计算机解决问题思路：

编写规则，定义“垃圾邮件”，让计算机执行
对于很多问题，规则很难定义
规则在不断变化

人类学习方式

机器学习

机器学习基础概念

数据

数据整体叫数据集（data set）
每一行数据称为一个样本（sample）
除最后一列，每一列表达样本的一个特征（feature）
最后一列，称为标记（label）

特征空间（feature space）
分类人物本质就是在特征空间切分
在高维空间同理

特征可以很抽象

图像，每一个像素点都是特征
2828的图像有2828=784个特征
如果是彩色图像特征更多

机器学习的基本任务

分类任务

二分类：

判断邮件是不是垃圾邮件
判断发给客户信用卡有没有风险
判断股票跌涨

多分类：

数字识别
图像识别
判断发给客户的信用卡的风险评级

一些算法只支持完成二分类的任务
但是多分类的任务可以转换成二分类的任务
一些算法天然可以完成多分类任务‘’
多标签分类：

回归任务

结果是一个连续数字的值，而非一个类别

房屋价格
市场分析
学习成绩
股票价格

一些算法只能解决回归问题
一些算法只能解决分类问题
一些算法的思路既能解决回归问题，又能解决分类问题
一些情况下，回归任务可以简化成分类任务

监督学习

给机器的训练数据拥有“标记”或者“答案”

图像已经拥有了标定信息
银行已经积累了一定的客户信息和他们信用卡的信用情况
医院已经积累了一定的病人信息和他们最终确诊是否患病的情况
市场积累了房屋的基本信息和最终成交的金额

分类回归
算法：

k近邻
线性回归和多项式回归
逻辑回归
SVM
决策树和随机森林

非监督学习

给机器的训练数据没有任何“标记”或者“答案”

对没有“标记”的数据进行分类-聚类分析

对数据进行降维处理

特征提取：信用卡的信用评级和人的胖瘦无关
特征压缩：PCA

降维处理的意义：方便可视化

异常检测

半监督学习

一部分数据有“标记”或者“答案”，另一部分数据没有
更常见：各种原因产生的标记缺失
通常都先使用无监督学习手段对数据做处理，之后使用监督学习手段做模型的训练和预测

增强学习

根据周围环境的情况，采取行动，根据采取行动的结果，学习行动方式

批量学习和在线学习

批量学习 Batch Learning

优点：简单
问题：如何适应环境变化？
解决方案：定时重新批量学习
缺点：每次重新批量学习，运算量巨大；在某些环境变化非常快的情况下，甚至不可能的

在线学习 Online Learning

优点：及时反映新的环境变化
问题：新的数据带来不好的变化？
解决方案：需要加强对数据进行监控
其他：也适用与数据量巨大，完全无法批量学习的环境

参数学习和非参数学习

参数学习 Parametric Learning

一旦学到了参数，就不再需要原有的数据集

非参数学习 Nonparametric Learning

不对模型进行过多假设
非参数不等于没参数

原文地址:https://blog.csdn.net/weixin_42403632/article/details/135730547 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1749269179833389056.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

相关推荐

机器学习基础入门

2024-01-22 11:14:07 55 阅读
机器学习入门笔记

2024-01-22 11:14:07 58 阅读
机器学习入门

2024-01-22 11:14:07 53 阅读
机器学习入门-----sklearn

2024-01-22 11:14:07 52 阅读
机器学习入门介绍

2024-01-22 11:14:07 37 阅读
【机器学习】机器学习简单入门

2024-01-22 11:14:07 51 阅读
机器学习入门：预测房价

2024-01-22 11:14:07 44 阅读
机器学习—1.快速入门

2024-01-22 11:14:07 37 阅读
一文入门机器学习

2024-01-22 11:14:07 29 阅读
实用机器学习（快速入门）

2024-01-22 11:14:07 24 阅读

最近更新

题解 - 序列

2024-01-22 11:14:07 117 阅读
CST热仿真案例——电动车直流快充Cable热仿真

2024-01-22 11:14:07 102 阅读
docker php8.1+nginx base 镜像 dockerfile 配置

2024-01-22 11:14:07 94 阅读
Could not load dynamic library ‘cudart64_100.dll‘

2024-01-22 11:14:07 101 阅读
NoSQL之Redis非关系型数据库

2024-01-22 11:14:07 101 阅读
2024.7.22 作业

2024-01-22 11:14:07 98 阅读
GDB调试正在运行的程序

2024-01-22 11:14:07 82 阅读
昇思25天学习打卡营第18天| DCGAN生成漫画头像

2024-01-22 11:14:07 85 阅读
在Django里面运行非项目文件

2024-01-22 11:14:07 82 阅读
SSD基本架构与工作原理

2024-01-22 11:14:07 87 阅读
在誉天学习完HCIE就业吗？

2024-01-22 11:14:07 94 阅读
【合同专题】合同终止协议书、项目合作协议、交底纪要、管理台账

2024-01-22 11:14:07 84 阅读
驾驭云原生日志洪流：高效分析与管理的策略集

2024-01-22 11:14:07 86 阅读
go 协程池的实现

2024-01-22 11:14:07 89 阅读
Shell脚本循环语句与函数

2024-01-22 11:14:07 89 阅读
连锁店收银系统源码（收银称重pos+聚合支付+ERP进销存+营销+会员管理）

2024-01-22 11:14:07 93 阅读
TIA博途V19无法勾选来自远程对象的PUT/GET访问的解决办法

2024-01-22 11:14:07 85 阅读
四大引用——强软弱虚

2024-01-22 11:14:07 87 阅读
Python语言-面向对象

2024-01-22 11:14:07 91 阅读
如何分清楚常见的 Git 分支管理策略Git Flow、GitHub Flow 和 GitLab Flow

2024-01-22 11:14:07 85 阅读
网站安全-CDN篇

2024-01-22 11:14:07 89 阅读

热门阅读

MySQL的执行流程

2024-01-22 11:14:07 59 阅读
初识C语言·自定义类型(1)

2024-01-22 11:14:07 51 阅读
AI日报：扎克伯格瞄准AGI通用人工智能

2024-01-22 11:14:07 71 阅读
词语的魔力：语言在我们生活中的艺术与影响

2024-01-22 11:14:07 39 阅读
Redis常见缓存问题

2024-01-22 11:14:07 54 阅读
玩转 SpEL 表达式

2024-01-22 11:14:07 47 阅读
Ceph应用

2024-01-22 11:14:07 38 阅读
【嘉立创EDA-PCB设计指南】4.模块化布局

2024-01-22 11:14:07 52 阅读
视频直播新时代，低延时直播交互，Web,Android,WebRtc推流拉流测试

2024-01-22 11:14:07 53 阅读
正则表达式

2024-01-22 11:14:07 57 阅读
jS-正则表达式(六)

2024-01-22 11:14:07 53 阅读
【QT+QGIS跨平台编译】之三：【OpenSSL+Qt跨平台编译】（一套代码、一套框架，跨平台编译）

2024-01-22 11:14:07 45 阅读
STM32 Hal库FreeRtos查看所有任务的内存栈信息使用情况剩余空间仅需一个函数搞定超简单

2024-01-22 11:14:07 66 阅读
Spring Cloud Validation 使用正则表达式校验

2024-01-22 11:14:07 52 阅读
正则表达式5分钟全解析

2024-01-22 11:14:07 46 阅读
使用Rancher管理Kubernetes集群

2024-01-22 11:14:07 40 阅读
[pytorch入门] 2. tensorboard

2024-01-22 11:14:07 53 阅读
万界星空科技MES系统的生产管理流程

2024-01-22 11:14:07 51 阅读
Cheating Gomoku Narabe（atcoder.jp）

2024-01-22 11:14:07 52 阅读
1.使用分布式文件系统Minio管理文件

2024-01-22 11:14:07 51 阅读
SQL Server修改数据字段名的方法

2024-01-22 11:14:07 56 阅读
[第二章—Spring MVC的高级技术] 2.3 处理异常

2024-01-22 11:14:07 58 阅读
PS滤镜插件：Adobe Camera Raw 16 for Mac中文激活版

2024-01-22 11:14:07 51 阅读
Stream toList不能滥用以及与collect(Collectors.toList())的区别

2024-01-22 11:14:07 54 阅读
RectMask2D不能合批的原因

2024-01-22 11:14:07 48 阅读
字符串展开(Python)

2024-01-22 11:14:07 49 阅读
SQL笔记 -- 多版本并发控制（MVCC）

2024-01-22 11:14:07 52 阅读
【图像拼接】源码精读：Single-Perspective Warps in Natural Image Stitching（SPW）

2024-01-22 11:14:07 58 阅读
Mysql学习笔记系列（一）

2024-01-22 11:14:07 48 阅读
Armv8-M的TrustZone技术解决的安全需求

2024-01-22 11:14:07 68 阅读