计算两个聚类结果的聚类准确性

PEREZje 发表于 Dev

32

追求

所以说我有两个如下的聚类结果：

clustering = [[8, 9, 10, 11], [14, 13, 4, 7, 6, 12, 5, 15], [1, 2, 0, 3]]
correct_clustering = [[2, 8, 10, 0, 15], [12, 13, 9, 14], [11, 3, 5, 1, 4, 6, 7]]

我怎么会去把包含在结果clustering中的一个包含correct_clustering。我想要一个介于0和1之间的数字。我正在考虑计算在同一群集中正确群集在一起的对的分数。但是无法想到以编程方式解决此问题的方法。

塞拉鲁克

使用兰德指数：

import numpy as np
from scipy.special import comb

def rand_index_score(clusters, classes):

    tp_plus_fp = comb(np.bincount(clusters), 2).sum()
    tp_plus_fn = comb(np.bincount(classes), 2).sum()
    A = np.c_[(clusters, classes)]
    tp = sum(comb(np.bincount(A[A[:, 0] == i, 1]), 2).sum()
             for i in set(clusters))
    fp = tp_plus_fp - tp
    fn = tp_plus_fn - tp
    tn = comb(len(A), 2) - tp - fp - fn
    return (tp + tn) / (tp + fp + fn + tn)

clusters = [0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2]

classes = [0, 0, 1, 0, 0, 0, 0, 1, 1, 1, 2, 1, 0, 2, 2, 2, 0]

rand_index_score(clusters, classes)
0.6764705882352942

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-21

我来说两句

0 条评论

登录后参与评论

上一篇：在节点上MySQL vs JSON

相关文章

在scipy中，层次聚类中使用的两个不同距离函数的意义是什么？

如何基于两个列表python计算准确性？

使用两个或多个列表进行聚类

如何计算聚类的量化误差？

如何有效地进行类间匹配以计算结果准确性

确定k均值聚类的准确性

如何计算两个树状图中两个个体之间或两种聚类方法之间的同位相似度？

如何衡量由层次聚类产生的两个聚类树之间的相似性？

聚类，Mclust（），提取聚类-R

在R中找到聚类结果

聚类算法的准确性是多少？

计算度数k的平均聚类

计算差异或比较两个字典-Groundtruth和聚类

基于两个唯一的列值熊猫创建聚类的功能

轨迹聚类：哪种聚类方法？

Matlab找到几个像素的聚类中心并计算聚类

基于皮尔逊相关性的聚类

聚类具有两个不同距离的点集

聚类结果的R-Hmisc归因

根据R中的两个顺序变量分配聚类/组

计算聚类的medoid（Python）

聚类-绘制最大的n个聚类

聚类计算的有效距离

从层次聚类中的聚类标签计算类的概率？

存储聚类结果

如何根据聚类结果计算水平值之间的差异？

在 R 中测量分层聚类（单链接）的准确性

基于成对相似性的聚类？

geom_tile 基于聚类结果

TOP 榜单

文章

热门标签

归档