如何通过使用python中的Z分数来计算相关性?

克里斯蒂安·托马西尼

我的熊猫数据框中的数据类似于下表:

  Z(A) Z(B) Z(TARGET)
1  0.4 0.17   0.96
2  0.2 0.37   0.45
3  0.1 -0.4   1.1
...

所以,是可以计算的相关性A,并BTARGET,通过仅使用Z值,优选与熊猫库?

我知道pandas库corr在其DataFrame类中有方法,并且我在这里看到了其他有关使用该方法的问题。不过,在这些问题的数据是原始数据(即ABTARGET),而我只有这些数据的z值(即Z(A)Z(B)Z(TARGET))。是否可以将corr函数也应用于Z表,还是需要计算AwithTARGETBwith与TARGET其他方法的相关性?

我知道这个问题更多的是数学问题,而不是编程问题,所以,抱歉,如果我把它张贴在错误的地方。但这与两者都有关系。

愤怒的螳螂

您不能在这里使用corr,至少不能单独使用。可以通过以下公式从z得分中获得Pearson相关性:http://davidmlane.com/hyperstat/A51911.html我将编写一个函数进行求和,然后使用for循环和df.iloc []遍历数据帧。它可能足够快,只是不够漂亮。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何通过NumPy使用广播来加快相关性计算?

如何计算与熊猫的滚动相关性?

如何在python 3中使用小数/数据检查相关性

我如何通过相关性在Rails中订购Ruby

如何计算python pandas数据框中行之间的相关性

如何计算大熊猫中的矛兵等级相关性?

在Elasticsearch中如何计算嵌套文档的相关性分数(TF / IDF)?

如何按组计算相关性

如何通过FFT计算卷积和相关性的组合?

使用dplyr计算分组数据中相关性的显着性

在Python中计算Pearson相关性

估计Python中的相关性

如何使用sklearn计算具有二进制相关性的NDCG?

如何计算与Python中性能最高的p值的相关性?

如何使用Postgresql计算不同组之间的相关性

如何使用map()函数计算变量之间的Pearson相关性?

如何使用双数来计算连续变量和分类变量之间的相关性?

在MQL4中如何计算Pearson的相关性?

如何计算rollapply中几列和一列之间的滚动相关性?

从 ArangoDB 中获取文本搜索相关性分数?

R:如何计算 EWMA 相关性

使用python执行变量的相关性

如何计算数据框列表中某些列之间的相关性?

如何计算Python中两个函数之间的相关性

您将如何计算 100 万列 CSV 中两列的相关性?

如何获得python中数据帧内的相关性?

使用 R 或 python 计算多个变量的 p 值的成对 Pearson 相关性

如何计算 R 中两个栅格数据集之间的相关性(r)?

如何计算r中数据框中每n行的2个变量的相关性?