超参数选择方法
交叉验证
是一种数据集的分割方法,将数据集划分为n份,拿一份做验证集(测试集)、其他n-1做训练集
交叉验证法,是划分数据集的一种方法,目的就是为了得到更加准确可信的模型评分
网格搜索
为什么需要网格搜索?
①模型有很多超参数,其能力也存在很大的差异。需要手动产生很多超参数组合,来训练模型
②每组超参数都采用交叉验证评估,最后选出最优参数组合建立模型
网格搜索是模型调参的有力工具,寻找最优超参数的工具
网格搜索+交叉验证的强力组合(模型选择和调优)
①交叉验证解决模型的数据输入问题(数据集划分)得到更可靠的模型
②网格搜索解决超参数的组合
③两个组合再一起形成一个模型参数调优的解决方案
案例利用KNN算法对鸢尾花分类-交叉验证网格搜索
案例利用KNN算法实现手写数字识别