我的数据框很大,我需要有效地计算数据框行和给定值列表之间的相关性。例如:
dfa= DataFrame(np.zeros((1,4)) ,columns=['a','b','c','d'])
dfa.ix[0] = [2,6,8,12]
a b c d
2.0 6.0 8.0 12.0
dfb= DataFrame([[2,6,8,12],[1,3,4,6],[-1,-3,-4,-6]], columns=['a','b','c','d'])
a b c d
0 2 6 8 12
1 1 3 4 6
2 -1 -3 -4 -6
我希望得到:
0 1
1 0.5
2 -0.5
我尝试了很多版本,例如:
dfb.T.corrwith(dfa.T, axis=0)
但我会得到很多南的
首先,请注意,最后2个相关是1和-1,而不是您期望的0.5和-0.5。
解
dfb.corrwith(dfa.iloc[0], axis=1)
结果
0 1.0
1 1.0
2 -1.0
dtype: float64
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句