梯度下降法的基本过程

学习率对梯度下降法的影响

学习率调整算法:Vanilla、Adagrad

adaptive与vanilla的比较

随机梯度下降法

特征归一化

证明梯度下降法的正确性

results matching ""

    No results matching ""