梯度下降法的收敛证明
公式(7),怎么证明?CS229里面说感知机算法没有数学依据?
决策树的剪枝算法
只实际了递归算法,怎么用DP实现?CART树的剪枝
为什么算法2步要强调自下而上计算g(t)?既然要把所有的a求出来,先算哪个结点的a应该不影响结果。[和推导] 的推导
(https://windmising.gitbook.io/lihang-tongjixuexifangfa/option/10)
公式(3)怎么推导到公式(4)[和推导] (https://windmising.gitbook.io/lihang-tongjixuexifangfa/option/10)
的推导 一次只优化其中一个变量,而固定其它变量,得:
【?】是一只优化一个还是一个? 【?】如果是只优化一个,为什么不能直接假设其它?
【?】如果是只优化一个,为什么算法6.1步骤2-(b)只更新一个?拟牛顿法 算法没看懂
线性可分SVM
7.1.3存在性和w的唯一性没看懂原始问题转换为对偶最优化问题
公式(5)代入公式(3)怎么得到公式(6)训练误差分析
公式(5)怎么得到公式(6)7.3.2 正定核
这一节从3开始就看不懂了,很多术语不懂
13."感知机学习算法的原始形式和对偶形式与第7章中支持向量机学习算法的原始形式和对偶形式相对应。"
感知机中的对偶与后面算法中的对偶是怎么对应的?[高斯混合模型的Q函数推导]过程有几一些地方没看懂(https://windmising.gitbook.io/lihang-tongjixuexifangfa/em/5)
9.4节,数据基础不够,看不懂。先去补补数学基础吧。
后向算法的初值是怎么来的?