机器学习第四章线性回归算法进阶4.3线性回归的正则化(《大话Python机器学习》学习笔记)
第四章线性回归算法进阶
4.3线性回归的正则化
4.3.1为什么要使用正则化
欠拟合(Underfitting): 采用一定的算法去拟合时,如果没有考虑相当的信息量(特征变量),从而对训练数据集的拟合算法无法精确,便会发生欠拟合现象。欠拟合也成为高偏差(Bias),即建立的模型拟合与预测效果较差。 解决方法:通过增加更多的特征变量,利用更高次幂的多项式当作假设函数,以该假设函数来拟合训练数据。 欠拟合的问题需要我们不断尝试各种合适的算法,优化算法中的参数挑中,以及通过数据预处理、数据可视化等特征工程,找到模型拟合效果最优化的结果。
过拟合(Overfitting): 采用一定的算法去拟合时,有时会有训练数据不够情况发生,也就是训练数据无法约束更多的特征变量,或者当模型过度训练的情况发生,便产生过拟合现象。也称作高方差(variance)。 过拟合过出现在特征变量过多的情况下,建立的模
机器学习第四章线性回归算法进阶4.3线性回归的正则化(《大话Python机器学习》学习笔记)最先出现在Python成神之路。
共有 0 条评论