深入浅出梯度下降算法背后的数学原理
深入浅出梯度下降算法背后的数学原理
0 前言1 什么是梯度?2 梯度下降是如何工作的?3 学习率4 如何确保梯度下降能够正常工作5 梯度下降的类型
0 前言
梯度下降是一种在训练机器学习模型时使用的优化算法,它基于凸函数并迭代调整其参数以将给定函数最小化到其局部最小值。
什么是梯度下降? 梯度下降是一种用于寻找可微函数的局部最小值的优化算法。梯度下降简单地用于机器学习中,以找到尽可能最小化成本函数的函数参数值。
因此,需要定义初始参数的值,然后梯度下降使用微积分迭代调整这些值,使它们最小化给定的成本函数。
1 什么是梯度?
要充分理解梯度下降这个概念,首先需要理解什么是梯度。
梯度只是衡量所有权重相对于误差变化的变化,因此可以将梯度看作是函数的斜率。梯度越高,斜率就越陡,模型可以学习的速度就越快。但是如果斜率为0,模型就会停止学习。从数学上来讲,梯度就是关于输入的偏导数。
共有 0 条评论