熊猫数据框比较具有特定条件的多行

沃德·尼伯尔

我希望我能正确地解释我的问题。.我有一个数据框（306x40），其中包含包含特定组数据的多行，我需要按索引对它们进行分组，这没有问题。接下来，我需要将这些行与具有特定条件的另一行进行比较。以以下数据为例：

Id  Condition   var1   var2   var3
1      1         0      1      0
1      3         1      1      0
2      2         0      0      1
2      3         0      0      1
2      1         0      0      1

因此，我需要将每个Id的var1，var2，var3与具有条件3的行进行比较。结果会让我知道任何变量都不同于条件3中的变量。可能的输出：

Id  Condition   var1   var2   var3  count_false
1      1        false  true   true      1
1      3        NaN    NaN    NaN       NaN
2      2        true   true   true      0
2      3        NaN    NaN    NaN       NaN
2      1        true   true   true      0

或者只是简单地说条件x与y Id的条件3不同

我希望你们能理解我的需求，但我很乐于阐述

提前非常感谢您！

编辑以使其更清楚：

数据由来自3种不同方法的患者细菌检测数据（临床数据）组成，请注意，每位患者使用的方法和次数不同。所以我有方法1、2、3，这些是不同的条件。变量是发现的不同细菌。方法1和2是黄金标准，方法3是需要验证的标准。所以我想看看方法3是否给出与方法1或方法2相同的结果。30多个变量是细菌，值1表示存在细菌，而0不存在。

用户名

与所需（条件）行进行比较时，＃x！= x.loc [i]为您提供每一行的真值。其余代码如下：

df=pd.DataFrame([[1,1,0,1,0],[1,3,1,1,0],[2,2, 0,0,1],[2,3, 0,0,1],[2,1, 0,0,1]],columns=['ID','Condition','var1','var2','var3'])
def comp(x):
    i=x.index[x['Condition']==3][0]
    #print(x!=x.loc[i])
    truth=(x[['var1','var2','var3']]==x.loc[i,['var1','var2','var3']])
    x=pd.concat([x[['ID','Condition']],truth],axis=1)
    return x
grp=df.groupby('ID').apply(comp)
grp['count_false']=grp[['var1','var2','var3']].apply(lambda x: 3-x.sum(),axis=1)
print(grp)

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-26

我来说两句

0 条评论

登录后参与评论

TOP 榜单

文章

熊猫数据框比较具有特定条件的多行

熊猫数据框比较具有特定条件的多行

Android Studio Kotlin：提取为常量

IE 11中的FormData未定义

计算数据帧R中的字符串频率

如何在R中转置数据

如何使用Redux-Toolkit重置Redux Store

Excel 2016图表将增长与4个参数进行比较

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

未捕获的SyntaxError：带有Ajax帖子的意外令牌u

OpenCv：改变 putText() 的位置

ActiveModelSerializer仅显示关联的ID

算术中的c ++常量类型转换

如何开始为Ubuntu开发

将加号/减号添加到jQuery菜单

去噪自动编码器和常规自动编码器有什么区别？

获取并汇总所有关联的数据

OpenGL纹理格式的颜色错误

在 React Native Expo 中使用 react-redux 更改另一个键的值

http：// localhost：3000 /＃！/为什么我在localhost链接中得到“＃！/”。

TreeMap中的自定义排序

Redux动作正常，但减速器无效

如何对treeView的子节点进行排序