熊猫：如何基于同一列中的两个条件选择行

狮子座

我有下表，我试图选择在数据框中的某些点在“ C”列中显示为“ D”和“ E”的“ col1”和“ col2”对。

col1    col2    C   val
aaa rte_1   D   58
aaa rte_2   E   47
bbb rte_3   D   2
aaa rte_4   E   35
aaa rte_5   E   95
ttt rte_6   E   84
aaa rte_1   D   57
ddd rte_2   C   36
aaa rte_3   C   13
aaa rte_4   C   28
aaa rte_5   E   3

换句话说，结果应该是

col1    col2    C   val
aaa rte_1   D   58
aaa rte_5   E   95
aaa rte_1   D   57
aaa rte_5   E   3

我已经尝试过类似的方法，但是我得到了一个空的数据框，因此显然是错误的。

d = {'col1' : ['aaa', 'aaa', 'bbb', 'aaa', 'aaa', 'ttt', 'aaa', 'ddd', 'aaa', 'aaa', 'aaa'], 'col2' : ['rte_1', 'rte_2', 'rte_3', 'rte_4', 'rte_5', 'rte_6, 'rte_1', 'rte_2', 'rte_3', 'rte_4', 'rte_5'], 'C' : ['D', 'E', 'D', 'E', 'E', 'E', 'D', 'C', 'C', 'C', 'E'], 'val' : ['58', '47', '2', '35', '95', '84', '57', '36', '13', '28', '3']}
df = pd.DataFrame(d)    
df2=df.loc[(df.C =='D')&(df.C =='E')]['A', 'B']

我怎样才能做到这一点？

编辑：当我说我想选择同时具有“ E”和“ D”的值时，我的意思是我想选择具有相同“ col1”和“ col2”对并具有“ D”的行，并且然后，在数据帧中的某个点，它们再次出现并带有“ E”（反之亦然，首先是“ E”，然后是“ D”）。我希望这可以澄清这个问题。

戴维·埃里克森

听起来您可能想尝试做的是查看组中的所有值是否仅为“ B”或“ E”。同时，您的预期输出还排除了满足该条件但只有一个成员的行。您可以GROUPBY你所提到的“配对”列和使用列表解析，检查是否所有的值要么D或E用all([True... )。我还添加了另一条逻辑and len(x) > 1，因为您的输出排除了只有一行的组。这将创建或的布尔系列s（如果满足条件），可用于直接在数据帧上进行过滤，并获取“预期输出”。TrueFalse

s = df.merge(df.groupby(['col1', 'col2'])['C'].apply(lambda x: all([True if y in ['D', 'E'] 
                                                                    and len(x) > 1 
                                                                    else False for y in x ]))
             .reset_index(),
             how='left', on=['col1', 'col2']).iloc[:,-1]
df[s]
Out[1]: 
   col1   col2  C  val
0   aaa  rte_1  D   58
4   aaa  rte_5  E   95
6   aaa  rte_1  D   57
10  aaa  rte_5  E    3

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-26

我来说两句

0 条评论

登录后参与评论

上一篇：使用声明式管道的waitUntil实现依赖并行任务的更优雅方法

TOP 榜单

文章

熊猫：如何基于同一列中的两个条件选择行

熊猫：如何基于同一列中的两个条件选择行

UITableView的项目向下滚动后更改颜色，然后快速备份

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Mac OS X更新后的GRUB 2问题

验证REST API参数

Java Eclipse中的错误13，如何解决？

带有错误“ where”条件的查询如何返回结果？

ggplot：对齐多个分面图-所有大小不同的分面

尝试反复更改屏幕上按钮的位置 - kotlin android studio

如何从视图一次更新多行（ASP.NET - Core）

计算数据帧中每行的NA

蓝屏死机没有修复解决方案

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

离子动态工具栏背景色

VB.net将2条特定行导出到DataGridView

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

在Windows 7中无法删除文件（2）

python中的boto3文件上传

当我尝试下载 StanfordNLP en 模型时，出现错误

Node.js中未捕获的异常错误，发生调用