我有下面的代码试图在两个列表之间找到相似的单词。为此,我使用了 spacy 的 .similarity 函数。
import en_vectors_web_lg
nlp = en_vectors_web_lg.load()
listx =['HSBC', 'JP Morgan',......] #500 words lists
listy = ['Currency','Blockchain'.......] #1000 words lists
s_words = []
for token1 in listy:
list_to_sort = []
for token2 in listx:
list_to_sort.append((token1, token2,nlp(str(token1)).similarity(nlp(str(token2)))))
sorted_list = sorted(list_to_sort, key = itemgetter(2), reverse=True)[0][:2]
s_words.append(sorted_list)
在运行上面的代码时,我不断收到警告: UserWarning: [W008] Evaluating Doc.similarity based on empty vectors"
我遇到了一些解决方案,例如设置环境变量“SPACY_WARNING_IGNORE=W008”来抑制错误“UserWarning: [W008] Evaluating Doc.similarity based on empty vectors”
我的问题是在哪里以及如何设置这个环境变量?
我使用的是 Windows 10、Spyder IDE、Python 3.7 和 Spacy 2.2.5。
您需要将以下行添加到您的代码中以设置该环境变量:
import os
os.environ['SPACY_WARNING_IGNORE'] = 'W008'
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句