如何计算两个向量的余弦相似度?

湿婆:

如何找到向量之间的余弦相似度?

我需要找到相似性来衡量两行文本之间的相关性。

例如,我有两个句子:

用户界面系统

用户界面机

…及其在tF-idf之后的向量,然后使用LSI进行标准化,例如[1,0.5][0.5,1]

如何测量这些向量之间的相似性?

马克戴维森:
public class CosineSimilarity extends AbstractSimilarity {

  @Override
  protected double computeSimilarity(Matrix sourceDoc, Matrix targetDoc) {
    double dotProduct = sourceDoc.arrayTimes(targetDoc).norm1();
    double eucledianDist = sourceDoc.normF() * targetDoc.normF();
    return dotProduct / eucledianDist;
  }
}

我最近在大学的信息检索部门做了一些tf-idf的工作。我使用了这种余弦相似度方法,该方法使用Jama:Java Matrix Package

有关完整的源代码,请参阅《IR Math with Java:相似性度量》,这是一个非常好的资源,涵盖了许多不同的相似性度量。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

计算Keras中两个张量之间的余弦相似度

如何找到一个向量与矩阵的余弦相似度

如何计算两个文本文档之间的相似度?

列表中两个词之间的余弦相似度

计算两个数组之间的余弦相似度的正确方法?

余弦相似度的SQL计算

如何计算两个张量之间的余弦相似度?

如何在Python中计算两个包含字符串的列表的Jaccard相似度?

两个大文件的平行余弦相似度

如何比较两个大文本之间的度量-余弦,Jaccard相似度,Sim_MinEdit(Sim_String)和Sim_Simple在Python中

Python:两个大型numpy数组之间的余弦相似度

如何计算PySpark中两个向量的余弦相似度?

计算R中两个单词的余弦相似度?

在Tensorflow中计算两组向量的余弦相似度

我有两个公式计算“余弦相似度”,有什么区别?

计算余弦相似度

如何计算两个数组之间的相似度?

如何计算两个字符串向量之间的余弦相似度

如何计算JavaScript中两个列表的相似度

如何通过向量表示图像或音频的余弦相似度?

计算两个向量之间的相似度

合并两个 CountVectorizers 并计算余弦相似度

如何使用特征向量计算两个图像之间的相似度得分?

如何调试这段代码计算两个unicode文件的余弦相似度?

如何取两个字典值在 Python 中找到余弦相似度?

最小化两个张量的余弦相似度并输出一个标量。火炬

计算 lambda 层中两个张量向量之间的余弦相似度?

如何编写一个返回两个文档之间余弦相似度的方法

计算两个相同形状矩阵的行之间的余弦相似度的最快方法是什么