根据两列过滤熊猫数据框

109

Godrebh：

我正在尝试基于两列过滤熊猫数据框，以便对于第一列中的每个值只保留那些行，其中第二列是最小的。我知道这样听起来很混乱，所以这里有个例子：

> df = pd.DataFrame([{'a':'anno1', 'ppm':1},{'a':'anno1', 'ppm':2},{'a':'anno2', 'ppm':2},{'a':'anno2', 'ppm':2}])

> df
       a  ppm
0  anno1    1
1  anno1    2
2  anno2    2
3  anno2    2

我想要行0,2和3，因为对于anno1，最小值ppm是1，对于anno2最小值ppm是2（保持两行！）。所以我从一个开始groupby：

> grouped_series = df.groupby(['a']).ppm.min()
> grouped_series
a
anno1    1
anno2    2

现在，我将每个值都a设为最小值ppm。但是，如何使用该系列过滤原始数据帧？还是有更简单的方法来做到这一点？我尝试了以下几种变化：

new_df = df.loc[ df.loc[:,'ppm']==grouped_series.loc[df.loc[:,'a']] , :]

但这给了我一个 ValueError: Can only compare identically-labeled Series objects

耶斯雷尔：

使用GroupBy.transform最少值Series大小相同的像df，所以比较好的工作，也为筛选boolean indexing在loc没有必要的：

new_df = df[df['ppm'] == df.groupby('a').ppm.transform('min')]
print (new_df)
       a  ppm
0  anno1    1
2  anno2    2
3  anno2    2

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-06-5

我来说两句

0 条评论

登录后参与评论

根据列列表值过滤熊猫数据框

根据两列的组合过滤熊猫数据框

根据两列对熊猫数据框重新采样

根据两列过滤熊猫数据框

根据两列过滤熊猫数据框

Qt Creator Windows 10 - “使用 jom 而不是 nmake”不起作用

使用next.js时出现服务器错误，错误：找不到react-redux上下文值；请确保组件包装在<Provider>中

SQL Server中的非确定性数据类型

Swift 2.1-对单个单元格使用UITableView

如何避免每次重新编译所有文件？

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

应用发明者仅从列表中选择一个随机项一次

在 Avalonia 中是否有带有柱子的 TreeView 或类似的东西？

HttpClient中的角度变化检测

在Wagtail管理员中，如何禁用图像和文档的摘要项？

如何了解DFT结果

Camunda-根据分配的组过滤任务列表

错误：找不到存根。请确保已调用spring-cloud-contract：convert

为什么此后台线程中未处理的异常不会终止我的进程？

构建类似于Jarvis的本地语言应用程序

使用分隔符将成对相邻的数组元素相互连接

您如何通过 Nativescript 中的 Fetch 发出发布请求？

通过iwd从Linux系统上的命令行连接到wifi（适用于Linux的无线守护程序）

使用React / Javascript在Wordpress API中通过ID获取选择的多个帖子/页面

使用 text() 獲取特定文本節點的 XPath