如何获取未知单词的随机word2vec向量?

Hao

我在火车数据上训练了word2vec,但是火车数据中没有测试数据中的某些单词,那么如何生成与数据分布或数字范围相匹配的单词向量呢?

阿舒托什·巴赫蒂(Ashutosh Baheti)

您可以获取词汇表中不常用单词的列表并将其平均,以获得未知单词的近似单词向量。

或者

假设您的目标未知单词isw和其在上下文c-2 c-1 w c1 c2c-2其中c-1c1c2是上下文单词。您可以将所有上下文单词的嵌入平均值作为未知单词的一个很好的近似值。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章