Pennington et. al., 2014. Glove: Global vectors for word representation
GloVe = Global Vector = 词向量
特点:简便
定义:
Xij为target i出现在context c中的次数
遍历corpus统计Xij。
Xij是否对称与如何定义context有关。
优化
i∑j∑f(Xij)(θi⊤ej+bi+bj′−logXij)2
关于f(Xij)
- 公式中f(Xij)为权重:
- 当Xij=0时,f(Xij)必须定义为0。否则上面这个公式没有意义。
- Xij可能差别很大,f(Xij)应保留Xij的大小关系(单调),但不能让它们的差别过于悬殊。
关于e和θ:
e和θ是对称的,因此将e和θ初始化为相同的值,迭代之后:
ewfinal=2ew+θw
这是因为在这个算法里,e和θ的意义是相同的,而之前的算法中e和θ不同。