Pennington et. al., 2014. Glove: Global vectors for word representation

GloVe = Global Vector = 词向量
特点:简便

  1. 定义:
    XijX_{ij}为target i出现在context c中的次数
    遍历corpus统计XijX_{ij}
    XijX_{ij}是否对称与如何定义context有关。

  2. 优化

ijf(Xij)(θiej+bi+bjlogXij)2 \sum_i\sum_j f(X_{ij})(\theta^\top_i e_j + b_i + b_j' - \log X_{ij})^2

关于f(Xij)f(X_{ij})

  1. 公式中f(Xij)f(X_{ij})为权重:
  2. Xij=0X_{ij} = 0时,f(Xij)f(X_{ij})必须定义为0。否则上面这个公式没有意义。
  3. XijX_{ij}可能差别很大,f(Xij)f(X_{ij})应保留XijX_{ij}的大小关系(单调),但不能让它们的差别过于悬殊。

关于eeθ\theta
eeθ\theta是对称的,因此将eeθ\theta初始化为相同的值,迭代之后:
ewfinal=ew+θw2 e_w^{final} = \frac{e_w + \theta_w}{2}

这是因为在这个算法里,eeθ\theta的意义是相同的,而之前的算法中eeθ\theta不同。

results matching ""

    No results matching ""