吴恩达机器学习笔记十六 如何debug一个学习算法 模型评估 模型选择和训练 交叉验证测试集

 如果算法预测出的结果不太好,可以考虑以下几个方面:

获得更多的训练样本

采用更少的特征

尝试获取更多的特征

增加多项式特征

增大或减小 λ 

模型评估(evaluate model)

例如房价预测,用五个数据训练出的模型能很好的拟合这几个数据,但不能泛化到新的数据。

将数据按70%、30%的比例分成两份,一份是训练集,一份是测试集。

模型选择

一种有缺陷的方法:

可以计算一阶多项式、二阶多项式、...、十阶多项式的J(w,b),看看哪一个更小 ,就选择哪个作为模型。但这样仍可能出现泛化的不好的情况。

好的方法:

 将数据集分成三部分,60%训练集(training set) ,20%交叉验证集(cross validation set  / developent set / dev set),20%测试集(test set)

三个部分的 error 计算公式如下

 

 可以选择交叉测试集误差最小的那个,然后用测试集误差来评估模型泛化的好坏。模型的选择要看模型在训练集和交叉验证集的好坏!不看测试集的结果。

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-03-11 19:30:04       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-03-11 19:30:04       100 阅读
  3. 在Django里面运行非项目文件

    2024-03-11 19:30:04       82 阅读
  4. Python语言-面向对象

    2024-03-11 19:30:04       91 阅读

热门阅读

  1. Claude与ChatGPT的对比

    2024-03-11 19:30:04       40 阅读
  2. uniapp地图围栏代码

    2024-03-11 19:30:04       43 阅读
  3. mysql笔记:5. 运算符

    2024-03-11 19:30:04       37 阅读
  4. 将本地项目上传git仓库

    2024-03-11 19:30:04       32 阅读
  5. RocketMQ学习笔记二

    2024-03-11 19:30:04       39 阅读
  6. 虚拟机部署elasticsearch集群

    2024-03-11 19:30:04       40 阅读