Mikolov et. al., 2013. Linguistic regualrities in continuous space word representations
1. 类比推理
man -> woman, king -> ?
2. 向量相减
eman−ewoman≈eking−ew
找到一个w使式子成立:
w=argwmaxsim(ew,eking−eman+ewoman)
公式中的sim代表相似度计算公式,有“余弦相似度”和“平方相似度”。余弦相似度更常用。
- 余弦相似度:
sim(u,v)=∣∣u∣∣2∣∣v∣∣2u⊤v
公式中的u⊤v计算u、v夹角的余弦值,因此称为余弦相似度。
- 平方相似度:
sim(u,v)=−∣∣u−v∣∣2