如何报告一列与熊猫中其他列的相关性

堆栈用户

我有一个数据:

df1 df2 df3 df4 df5
1    3  3   4    5
4    4  3   4    3
5    5  1   -2   1
9    7  3   0    -2

我想报告 df1 列与其他列(df2、df3、df4 和 df5)之间的相关性的强关系

输出应如下所示:

df1 is strongly corelated to df2
 df1 is not strongly corelated to df3
 df1 is not strongly corelated to df4
 df1 is strongly corelated to df5
耶斯列

Onde ide a 是使用DataFrame.corrwith,这里定义了强相关性,如绝对值更大,如0.7

m = df.corrwith(df.pop('df1')).abs().gt(0.7)
print (m)
df2     True
df3    False
df4    False
df5     True
dtype: bool

for k, v in m.items():
    if v:
       print (f'df1 is strongly corelated to {k}')
    else:
       print (f'df1 is not strongly corelated to {k}')
       
df1 is strongly corelated to df2
df1 is not strongly corelated to df3
df1 is not strongly corelated to df4
df1 is strongly corelated to df5

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

计算一列与其他列的选择之间的相关性而无循环

熊猫:如何计算一列与多列之间的相关性?

如何计算rollapply中几列和一列之间的滚动相关性?

计算每对熊猫中两列之间的相关性

如何根据另一列中的间隔填充熊猫中其他列的缺失值?

熊猫如何根据其他列中的值汇总一列的总和

熊猫:创建将一列与其他两列相关的数据框

熊猫过滤一列中的多个同名条目以提供另一列中的所有其他相关项目

tidyverse-由其他列分组的多个列之间的相关性

如何使用其他两列(熊猫)中的数据替换一列中的字符串

如何删除与熊猫中另一列中的值相关的列中的重复项?

大熊猫:获取相关性高的列的组合

如何根据其他两列设置一列熊猫的样式?

如何在不更改熊猫其他列的情况下对一列进行排序?

对一列进行分组并查找熊猫中其他两列的差的最大(绝对)值

熊猫用其他替换一列值

基于 Python 中其他列值的相似性对一列求和

如何根据多列其他列中的值减去一列中的值?

替换以熊猫中其他两列为条件的一列的值

您将如何计算 100 万列 CSV 中两列的相关性?

如何使用前一行的值以及同一行中其他列的值来计算熊猫中一列的值

如何计算与熊猫的滚动相关性?

如何使一列在其他列中具有唯一值

熊猫:如何按一列分组并显示每组所有其他列的唯一值计数?

如何根据其他列查找一列的区别

如何将其他列中的字符收集到一列中?

如何根据R中其他列的值过滤一列中的值?

如何根据psql中其他列的值删除一列中的重复项

如何使用基于多个列的bigquery相关性?