熊猫在groupby中设置值

布鲁斯·普契（Bruce Pucci）

我有一个DataFrame ...

>>> df = pd.DataFrame({
...            'letters' : ['a', 'a', 'a', 'b', 'b', 'b', 'c', 'c', 'c'], 
...            'is_min' : np.zeros(9),
...            'numbers' : np.random.randn(9)
... })

    is_min  letters numbers
0   0       a       0.322499
1   0       a      -0.196617
2   0       a      -1.194251
3   0       b       1.005323
4   0       b      -0.186364
5   0       b      -1.886273
6   0       c       0.014960
7   0       c      -0.832713
8   0       c       0.689531

如果“数字”是列“字母”的最小值，我想将“ is_min” col设置为1。我已经尝试过了，觉得自己很亲近...

>>> df.groupby('letters')['numbers'].transform('idxmin')

0    2
1    2
2    2
3    5
4    5
5    5
6    7
7    7
8    7
dtype: int64

我很难连接各个点以将'is_min'的val设置为1。

埃德·楚姆

将行标签传递给loc并设置列：

In [34]:
df.loc[df.groupby('letters')['numbers'].transform('idxmin'), 'is_min']=1
df

Out[34]:
   is_min letters   numbers
0       1       a -0.374751
1       0       a  1.663334
2       0       a -0.123599
3       1       b -2.156204
4       0       b  0.201493
5       0       b  1.639512
6       0       c -0.447271
7       0       c  0.017204
8       1       c -1.261621

因此，这里发生的是，通过调用，loc我们仅选择您的transform方法返回的行，并将其设置1为所需的行。

不知道这是否重要，但是您可以致电unique以便您仅获得行标签而无需重复，这可能会更快：

df.loc[df.groupby('letters')['numbers'].transform('idxmin').unique(), 'is_min']=1

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-11-2

我来说两句

0 条评论

登录后参与评论

上一篇：ViewHolder布局更新不适用于onBindViewHolder（）

将列表设置为熊猫数据框的列中的值

熊猫groupby为零值

熊猫-检查数据框groupby中的非唯一值

汇总熊猫GroupBy中的列值作为dict

如何在图表中绘制熊猫groupby值？

如何在熊猫中设置特定的单元格值？

熊猫的groupby（）和索引值

在Pandas Groupby中设置组值

将行中的最高值设置为1，将熊猫中的值设置为0

设置熊猫MultiIndex系列中的值

在Python中的熊猫数据帧上从groupby选择索引值

设置列值在熊猫0.22中失败

熊猫groupby的非缺失值

根据条件在熊猫数据框中的多行中设置值

获取与熊猫GroupBy中的最大值对应的行

如何在熊猫中设置两列的值

熊猫：获取数组中的所有groupby值

熊猫-根据列中的先前值设置值

汇总熊猫GroupBy中的多个列值作为dict

熊猫groupby有多个列，但是groupby之后需要在列中显示唯一值

为熊猫中的groupby的组分配值

在熊猫mulitindex中设置值失败

熊猫：如果列中的值是字典，则使用groupby

熊猫的groupby统计数据中的NaN值

将值设置为熊猫数据框中的多行

在熊猫中重新采样：设置时间的起始值

在 groupby 熊猫中有条件地设置值

熊猫：groupby 中的时差

初始熊猫数据框中每年的 groupby 最大值

TOP 榜单

文章

熊猫在groupby中设置值

熊猫在groupby中设置值

Linux的官方Adobe Flash存储库是否已过时？

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

如何检查字符串输入的格式

如何使用HttpClient的在使用SSL证书，无论多么“糟糕”是

Modbus Python施耐德PM5300

错误TS2365：运算符'！=='无法应用于类型'“（”'和'“）”'

用日期数据透视表和日期顺序查询

检查嵌套列表中的长度是否相同

Java Eclipse中的错误13，如何解决？

ValueError：尝试同时迭代两个列表时，解包的值太多（预期为 2）

如何监视应用程序而不是单个进程的CPU使用率？

如何自动选择正确的键盘布局？-仅具有一个键盘布局

ES5的代理替代

在令牌内联程序集错误之前预期为 ')'

有什么解决方案可以将android设备用作Cast Receiver？

套接字无法检测到断开连接

如何在JavaScript中获取数组的第n个元素？

如何将sklearn.naive_bayes与（多个）分类功能一起使用？

应用发明者仅从列表中选择一个随机项一次

在Windows 7中无法删除文件（2）

ggplot：对齐多个分面图-所有大小不同的分面