按功能过滤熊猫索引

隐性的

我想通过沿索引的函数过滤熊猫数据框。我似乎找不到执行此操作的内置方法。

因此，从本质上讲，我具有一个函数，该函数可以通过一些任意复杂的方法来确定是否应包含特定索引，filter_func在本示例中将其称为。我希望将以下代码的功能完全应用，但要应用到索引：

new_index = filter(filter_func, df.index)

并且仅包括filter_func允许的值。索引也可以是任何类型。

这是数据操作的一个非常重要的因素，因此我想有一种内置的方法可以执行此操作。

和：

我发现按布尔值列表索引数据帧将满足我的要求，但仍需要索引空间的两倍才能应用过滤器。所以我的问题仍然存在，即是否有一种内置的方法不需要占用两倍的空间。

这是一个例子：

import pandas as pd
df = pd.DataFrame({"value":[12,34,2,23,6,23,7,2,35,657,1,324]})

def filter_func(ind, n=0):
    if n > 200: return False
    if ind % 79 == 0: return True
    return filter_func(ind+ind-1, n+1)

new_index = filter(filter_func, df)

我想这样做：

mask = []
for i in df.index:
    mask.append(filter_func(i))
df = df[mask]

但是这样做不会占用索引空间的两倍

您可以使用map而不是filter，然后进行布尔索引：

df.loc[map(filter_func,df.index)]

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-25

我来说两句

0 条评论

登录后参与评论

熊猫按功能过滤数据框行

熊猫的错误/功能，其中按日期过滤的多索引数据框在提取日期索引级别时返回所有未过滤的日期

按条件过滤熊猫

按熊猫分组索引

熊猫按功能聚合

如何在熊猫数据框中按索引过滤重复的行？

熊猫按日期过滤值

熊猫按日期过滤条目

熊猫，按数量过滤

熊猫按列列表过滤

熊猫Groupby按索引排序

按熊猫索引列表搜索

按熊猫行索引分组

按索引熊猫删除列

按索引“INT”搜索熊猫

如果列表中有索引，熊猫按功能分组以执行不同的方法

按索引过滤数组

熊猫-按不在索引中的索引

熊猫：按功能分组并聚合

Python-过滤熊猫时间戳索引

熊猫数据框索引过滤

根据索引过滤熊猫数据框

在多索引熊猫数据框中过滤

熊猫：按多个条件过滤组？

熊猫在groupby中按条件过滤

按可变大熊猫过滤

熊猫按多列过滤NULL

熊猫：按组过滤唯一值

熊猫按季度结束日期过滤

TOP 榜单

文章

按功能过滤熊猫索引

按功能过滤熊猫索引

Android Studio Kotlin：提取为常量

计算数据帧R中的字符串频率

如何使用Redux-Toolkit重置Redux Store

http：// localhost：3000 /＃！/为什么我在localhost链接中得到“＃！/”。

如何使用tweepy流式传输来自指定用户的推文（仅在该用户发布推文时流式传输）

TreeMap中的自定义排序

TYPO3：将 Formhandler 添加到新闻扩展

遍历元素数组以每X秒在浏览器上显示

在Ubuntu和Windows中，触摸板有时会滞后。硬件问题？

警告消息：在matrix（unlist（drop.item），ncol = 10，byrow = TRUE）中：数据长度[16]不是列数的倍数[10]>？

无法连接网络并在Ubuntu 14.04中找到eth0

将辅助轴原点与主要轴对齐

我可以ping IPv6但不能ping IPv4

在Jenkins服务器中使用Selenium和Ruby进行的黄瓜测试失败，但在本地计算机中通过

提交html表单时为空

使用C ++ 11将数组设置为零

如果从DB接收到的值为空，则JMeter JDBC调用将返回该值作为参数名称

尝试在Dell XPS13 9360上安装Windows 7时出错

如何在R中转置数据

无法使用 envoy 访问 .ssh/config

未捕获的SyntaxError：带有Ajax帖子的意外令牌u