4、机器学习的模型验证

2024-01-22 12:30:03
开发
57

测量模型的性能，以便测试和比较备选方案。

本课程所需数据集夸克网盘下载链接：https://pan.quark.cn/s/9b4e9a1246b2
提取码：uDzP

文章目录

1、模型验证（Model Validation）是什么
2、“样本内”分数的问题
3、使用代码实现
Wow!
Your Turn

你已经建立了一个模型，但是这个模型有多好？

在这节课中，你将学习如何使用模型验证来衡量模型的质量。衡量模型质量是迭代改进模型的关键。

在机器学习中，模型验证是评估模型性能的重要步骤。通过模型验证，你可以了解模型的预测能力、过拟合或欠拟合的情况，以及如何改进模型。

一种常见的模型验证方法是使用交叉验证。交叉验证将数据集分成训练集和测试集，并多次重复训练和测试过程。每次迭代中，一部分数据用于训练模型，另一部分数据用于测试模型。通过比较模型的预测结果和实际结果，可以计算模型的准确率、精度、召回率等指标，从而评估模型的性能。

除了交叉验证，还有其他一些常用的模型验证方法，如留出验证和自助验证。留出验证是将数据集分成训练集和测试集，并只进行一次训练和测试。自助验证则通过随机采样数据来创建训练集和测试集，每次采样的数据都不相同。

总之，模型验证是评估和改进模型的关键步骤。通过使用交叉验证、留出验证和自助验证等方法，你可以了解模型的性能，发现模型的不足之处，并采取相应的措施来改进模型。

1、模型验证（Model Validation）是什么

你会想要评估你所建立的几乎每一个模型。在大多数（尽管不是所有）应用中，模型质量的相关衡量标准是预测准确性。换句话说，模型的预测会接近实际情况吗。

许多人在测量预测准确性时会犯一个巨大的错误。他们用训练数据进行预测，并将这些预测与训练数据中的目标值进行比较。您稍后会看到这种方法的问题以及如何解决它，但让我们先想想如何做到这一点。

您首先需要将模型质量总结为一种可以理解的方式。如果你比较10000套房子的预测和实际房价，你可能会发现预测好坏参半。浏览一个包含10000个预测值和实际值的列表是毫无意义的。我们需要将其总结为一个单一的指标。

总结模型质量有很多指标，但我们将从一个称为平均绝对误差（也称为MAE）的指标开始。让我们从最后一个词“错误”开始分解这个指标。

每栋房屋的预测误差为：

error=actual−predicted

原文地址:https://blog.csdn.net/jiangxinufo00/article/details/135664702 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1749288291146010624.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

最近更新

题解 - 序列

2024-01-22 12:30:03 116 阅读
CST热仿真案例——电动车直流快充Cable热仿真

2024-01-22 12:30:03 102 阅读
docker php8.1+nginx base 镜像 dockerfile 配置

2024-01-22 12:30:03 94 阅读
Could not load dynamic library ‘cudart64_100.dll‘

2024-01-22 12:30:03 100 阅读
NoSQL之Redis非关系型数据库

2024-01-22 12:30:03 101 阅读
2024.7.22 作业

2024-01-22 12:30:03 97 阅读
GDB调试正在运行的程序

2024-01-22 12:30:03 81 阅读
昇思25天学习打卡营第18天| DCGAN生成漫画头像

2024-01-22 12:30:03 85 阅读
在Django里面运行非项目文件

2024-01-22 12:30:03 82 阅读
SSD基本架构与工作原理

2024-01-22 12:30:03 87 阅读
在誉天学习完HCIE就业吗？

2024-01-22 12:30:03 94 阅读
【合同专题】合同终止协议书、项目合作协议、交底纪要、管理台账

2024-01-22 12:30:03 84 阅读
驾驭云原生日志洪流：高效分析与管理的策略集

2024-01-22 12:30:03 85 阅读
go 协程池的实现

2024-01-22 12:30:03 89 阅读
Shell脚本循环语句与函数

2024-01-22 12:30:03 89 阅读
连锁店收银系统源码（收银称重pos+聚合支付+ERP进销存+营销+会员管理）

2024-01-22 12:30:03 93 阅读
TIA博途V19无法勾选来自远程对象的PUT/GET访问的解决办法

2024-01-22 12:30:03 85 阅读
四大引用——强软弱虚

2024-01-22 12:30:03 86 阅读
Python语言-面向对象

2024-01-22 12:30:03 91 阅读
如何分清楚常见的 Git 分支管理策略Git Flow、GitHub Flow 和 GitLab Flow

2024-01-22 12:30:03 85 阅读
网站安全-CDN篇

2024-01-22 12:30:03 88 阅读