如何根据 groupby 列表的多个值对数据框进行子集化

最棒的

我有一个如下所示的数据框

ID,color
1, Yellow
1, Red
1, Green
2, Red
2, np.nan
3, Green
3, Red
3, Green
4, Yellow
4, Red
5, Green
5, np.nan
6, Red
7, Red
8, Green
8, Yellow

fd = pd.read_clipboard(sep=',')
fd = fd.groupby('ID',as_index=False)['color'].aggregate(lambda x: list(x))

正如您在输入数据框中看到的那样，某些 ID 具有与其关联的多种颜色。

现在，我想创建一个数据框的子集，其 ID 具有Yellow和Green

因此，我尝试了以下方法并获得了每个 ID 的颜色列表

fd.groupby('ID',as_index=False)['color'].aggregate(lambda x: list(x))

我想检查groupby 列表中的和之类的值，然后对数据框进行子集Yellow化Green

我希望我的输出如下所示（只有两个 ID 同时具有黄色和绿色）

更新

输入数据框如下所示

舒巴姆·夏尔马

过滤颜色为黄色或绿色的行，然后将数据框分组ID并转换颜色nunique以检查ID具有 2 个唯一颜色。

s = df[df['color'].isin(['Yellow', 'Green'])]
s.loc[s.groupby('ID')['color'].transform('nunique').eq(2), 'ID']

结果

0     1
2     1
14    8
15    8
Name: ID, dtype: int64

根据新要求更新，这里我假设df1是在以下之后获得的输入数据帧groupby：

s = pd.DataFrame([*df1['color']])
df1[s.mask(~s.isin(['Yellow', 'Green'])).nunique(1).eq(2)]

结果：

   ID                 color
0   1  [Yellow, Red, Green]
7   8       [Green, Yellow]

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2022-03-23

我来说两句

0 条评论

登录后参与评论

上一篇：在 awk 中動態創建 n 個數組

如何根据 groupby 列表的多个值对数据框进行子集化

如何根据 groupby 列表的多个值对数据框进行子集化

材质UI垂直滑块。如何改变在垂直材料UI滑块导轨的厚度（反应）

隐藏发件人没有短信PHP

在Windows 7中无法删除文件（2）

HttpClient中的角度变化检测

Java Eclipse中的错误13，如何解决？

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

在浏览器中请求URL时会发生什么？

flask-admin 如何自定义删除按钮

java io ioexception无法解析服务器地址解析器的响应

jOOQ：在特定表中查找约束

Flexbox CSS 对齐属性环境惰性？

共享图像将路径放入地址

加载Microsoft Visual菜单时出现问题

Powerpoint-条形长度错误的堆积条形图

应用发明者仅从列表中选择一个随机项一次

在Angular2中的输入值之前添加加号“ +”

检查errno！= EINTR：这是什么意思？

ClickHouse 创建临时表

ggplot：对齐多个分面图-所有大小不同的分面

Azure VM启动/停止日志

是否可以通过编程方式对很多动画进行重新着色？