选择 .groupby() 之外的列

amatof 发表于 Dev

4

阿马托夫

我正在使用 Python 中的数据集，该数据集包含三列：州 (ST)、城市 (City) 和证书数量 (CERT)。我必须找到使用以下代码完成的每个州的最少证书数量：

df.groupby(["ST"])["CERT"].min()

但是当我还需要输出城市时，这只返回状态和证书数量。我需要每个州拥有最少证书数量的城市。当我运行以下代码时：

df.groupby(["ST", "City"])["CERT"].min()

当我需要每个州的最小值以及该最小值所属的城市时，我得到了每个城市的最小值。有没有办法在 .groupby 函数之外包含 City 列？

恩克

您可以使用groupby+idxmin来获取最小值的索引，然后df使用它进行过滤loc：

index_of_min_certificates = df.groupby('ST')['CERT'].idxmin()
out = df.loc[index_of_min_certificates]

例如，df如下所示：

   ST    City  CERT
0  CA      LA     0
1  CA      SF     1
2  NY     NYC     2
3  NY  Albany     3

上面的代码产生：

   ST City  CERT
0  CA   LA     0
2  NY  NYC     2

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2022-04-8

我来说两句

0 条评论

登录后参与评论

上一篇：使用 Golang + Gin + Docker 时“本地主机没有发送任何数据”

相关文章

选择 .groupby() 之外的列

选择 .groupby() 之外的列

Groupby用于选择多列Pandas python

在 Pandas 中选择不同的值 groupby 列

从GroupBy列表中选择特定的列

如何从熊猫的groupby对象中选择列？

如何在pandas groupby上选择列

选择不在GroupBy中的列的值

pyspark collect_set在groupby之外的列

使用groupby选择行，对列求和，并使用所有groupby元素的总和创建新列

Pandas - 在 groupby 之后从嵌套标题中选择多列

选择新的＆多个GroupBy列中的Linq Min

Pyspark - 在 groupby 和 orderBy 之后选择列中的不同值

选择角度：GroupBy选择数组

从熊猫数据框groupby中提取计数之外的新列

Pyspark：选择除特定列之外的所有列

Spring Boot Jpa JPQL选择除特定列之外的列

用groupby选择Max

GroupBy之后的条件选择

MySQL选择groupby行

从ORACLE数据库的列中选择XML之外的数据

如何选择除某些行和列之外的整个矩阵？

选择除自动递增列之外的所有列

选择除2列之外的所有行

Pandas groupby：在基于Pandas groupby组中另一列中的数据选择行之后，如何选择相邻列的数据？

从python中的另一列groupby之后的列中选择一个值

在 EF 6 中按两列选择 Min() 和其他列和 GroupBy

Pandas groupby 2 列，选择第 3 列的最大值

熊猫groupby和boolean选择

TOP 榜单

文章

热门标签

归档