我的熊猫数据框中的数据类似于下表:
Z(A) Z(B) Z(TARGET)
1 0.4 0.17 0.96
2 0.2 0.37 0.45
3 0.1 -0.4 1.1
...
所以,是可以计算的相关性A
,并B
用TARGET
,通过仅使用Z值,优选与熊猫库?
我知道pandas库corr
在其DataFrame
类中有方法,并且我在这里看到了其他有关使用该方法的问题。不过,在这些问题的数据是原始数据(即A
,B
,TARGET
),而我只有这些数据的z值(即Z(A)
,Z(B)
,Z(TARGET)
)。是否可以将corr
函数也应用于Z表,还是需要计算A
withTARGET
和B
with与TARGET
其他方法的相关性?
我知道这个问题更多的是数学问题,而不是编程问题,所以,抱歉,如果我把它张贴在错误的地方。但这与两者都有关系。
您不能在这里使用corr,至少不能单独使用。可以通过以下公式从z得分中获得Pearson相关性:http://davidmlane.com/hyperstat/A51911.html。我将编写一个函数进行求和,然后使用for循环和df.iloc []遍历数据帧。它可能足够快,只是不够漂亮。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句