对熊猫数据帧的多列进行条件过滤

地主

我有一个熊猫数据框，其中有三列，即A（日期），B（分类值）和C（实际值）。

A     |  B   |  C
01-19 |  5   |  0.34
01-19 |  3   |  0.25
01-19 |  7   |  0.07
01-20 |  5   |  0.15
01-20 |  2   |  0.36

等等。

我想要的是根据日期和特定阈值来过滤行-类似于：

[(01-19, x<6), (01-20, x<3)]

在那种情况下会给我

A     |  B   |  C
01-19 |  5   |  0.34
01-19 |  3   |  0.25
01-20 |  2   |  0.36

我的解决方案是使用A和B设置多索引，但是我不完全确定如何过滤B。

耶斯列尔

想法是为A列的所有值创建阈值字典，然后创建Series.map新的Series，因此可以按B列比较并按以下条件过滤boolean indexing：

d = {'01-19': 6, '01-20' : 3}
df = df[df['B'] < df['A'].map(d)]
print (df)
       A  B     C
0  01-19  5  0.34
1  01-19  3  0.25
4  01-20  2  0.36

详细说明：

print (df['A'].map(d))
0    6
1    6
2    6
3    3
4    3
Name: A, dtype: int64

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-21

我来说两句

0 条评论

登录后参与评论

上一篇：在节点上MySQL vs JSON

从熊猫数据帧加载的QTableView中的多列过滤错误

根据多列条件过滤熊猫数据框行

熊猫使用单个条件过滤多列

基于多列的NA过滤数据帧

根据条件熊猫过滤数据帧（字符串拆分）

熊猫根据前n行的条件过滤数据帧

如何从多个熊猫数据帧创建多列的摘要？

在R中的循环内过滤数据帧的多列

熊猫是多列条件

按行而不是按列对熊猫数据帧进行排名？

如何按多列过滤熊猫数据框

如何根据多列过滤熊猫数据集？

通过独立分组多列进行pyspark数据帧转换

熊猫在列级别对多列数据进行分组

根据 R 中数据帧中另一列的条件过滤数据帧

通过对熊猫的不同列应用条件来过滤数据框

使用R中不同数据帧的过滤信息从数据帧中的列进行随机采样

根据数据帧中的条件进行分组的列

根据条件重命名熊猫数据框的多列

根据条件融化多列熊猫数据框

熊猫if else条件使用数据框的多列

使用阈值级别熊猫过滤数据帧

按频率过滤熊猫数据帧

熊猫基于两列（多索引）进行数据透视

如何对多列进行分组以在熊猫数据框中列出

使用列中的值对熊猫数据框进行多索引

通过柱值进行过滤熊猫catagorical数据帧然后更新它的类别

多指标大熊猫从数据帧

cumsum（）在多索引熊猫数据帧上

TOP 榜单

文章

对熊猫数据帧的多列进行条件过滤

对熊猫数据帧的多列进行条件过滤

Linux的官方Adobe Flash存储库是否已过时？

如何使用HttpClient的在使用SSL证书，无论多么“糟糕”是

错误：“ javac”未被识别为内部或外部命令，

Modbus Python施耐德PM5300

为什么Object.hashCode（）不遵循Java代码约定

如何正确比较 scala.xml 节点？

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

在令牌内联程序集错误之前预期为 ')'

数据表中有多个子行，asp.net核心中来自sql server的数据

VBA 自动化错误：-2147221080 (800401a8)

错误TS2365：运算符'！=='无法应用于类型'“（”'和'“）”'

如何在JavaScript中获取数组的第n个元素？

检查嵌套列表中的长度是否相同

如何将sklearn.naive_bayes与（多个）分类功能一起使用？

ValueError：尝试同时迭代两个列表时，解包的值太多（预期为 2）

ES5的代理替代

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

如何监视应用程序而不是单个进程的CPU使用率？

如何检查字符串输入的格式

解决类Koin的实例时出错

如何自动选择正确的键盘布局？-仅具有一个键盘布局