【机器学习】欠拟合与过拟合

在这里插入图片描述
过拟合:模型在训练数据上表现良好对不可见数据的泛化能力差。

欠拟合:模型在训练数据和不可见数据上泛化能力都很差。

欠拟合常见解决办法

(1)增加新特征,可以考虑加入特征组合、高次特征,以此增大假设空间。

(2)添加多项式特征,这个在机器学习算法里用得很普遍,例如将线性模型通过添加二次项或者三次项使模型泛化能力更强。

(3)减少正则化参数,正则化的目的是用来防止过拟合,但是模型出现了欠拟合,则需要减少正则化参数。

(4)使用非线性模型,例如支持向量机、决策树、深度学习等模型。

(5)调整模型的容量(Capacity),通俗地讲,模型的容量是指其拟合各种函数的能力。

(6)使用集成学习方法,如使用Bagging,可将多个弱学习器Bagging。

过拟合常见解决办法

(1)使用权值衰减的方法,即每次迭代过程中以某个小因子降低每个权值。

(2)选取合适的停止训练标准,使对机器的训练在合适的程度。

(3)保留验证数据集,对训练成果进行验证。

(4)获取额外数据进行交叉验证

(5)正则化,即在进行目标函数或代价函数优化时,在目标函数或代价函数后面加上一个正则项,一般有L1正则与L2正则等。

相关推荐

  1. 机器学习

    2024-01-29 21:46:01       44 阅读
  2. 机器学习笔记——

    2024-01-29 21:46:01       10 阅读

最近更新

  1. TCP协议是安全的吗?

    2024-01-29 21:46:01       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-01-29 21:46:01       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-01-29 21:46:01       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-01-29 21:46:01       20 阅读

热门阅读

  1. jvm垃圾回收器

    2024-01-29 21:46:01       42 阅读
  2. 利用aspose进行word转pdf、打印pdf

    2024-01-29 21:46:01       46 阅读
  3. 爬虫学习笔记-站长素材网站图片下载

    2024-01-29 21:46:01       30 阅读
  4. Linux之父:我们正在从C语言转向Rust

    2024-01-29 21:46:01       35 阅读
  5. 【Python笔记】设计模式

    2024-01-29 21:46:01       42 阅读
  6. 计算机网络之三次握手,四次挥手

    2024-01-29 21:46:01       36 阅读
  7. Mongodb查询投射中的$elemMatch

    2024-01-29 21:46:01       36 阅读
  8. VLM 系列——Monkey——论文解读

    2024-01-29 21:46:01       41 阅读
  9. Web 上升的圆心

    2024-01-29 21:46:01       27 阅读