根据另一列中的一些多个过滤器值匹配列中的子字符串并使用 Pandas 聚合计数

Ehsan125

我正在努力根据列Name中存在的 subtring 找到 count 列的总和。子字符串应该与另一个列中存在的其他多个值共存，即错误名称。如果子字符串（例如 Ehsan）匹配并且另一列（即错误名称）具有这些多个值（设备和线路错误），那么我将在计数列中进行一些计数。请记住，我只需要对名称和设备中具有子字符串 Ehsan和错误名称中的行错误的计数求和以下是我的原始数据：

我的输出应该是这样的：

请需要帮助，谢谢

马赫迪

编辑问题后：您需要选择包含的行，Ehsan然后pandas.groupby在结果上使用，dataframe如下所示：

mask_name = df['Name'].str.contains(r'.*(?:Ehsan).*')
mask_err = df['Error Name'].str.contains(r'(?:\bLine Error\b|\bDevice\b)')
df = df[mask_name & mask_err]
df.groupby(['Name', 'Error Name'])['Count'].sum().reset_index()

在编辑问题之前：您可以为列编写一个掩码Name，然后在两个掩码中选择Error Name具有regexTrue 的Count行，并对这些行求和pandas.loc，pandas.sum如下所示：

mask_name = df['Name'].str.contains(r'.*(?:Ehsan).*')
mask_err = df['Error Name'].str.contains(r'(?:\bLine Error\b|\bDevice\b)')
df.loc[mask_name & mask_err, 'Count'].sum()

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2022-08-17

我来说两句

0 条评论

登录后参与评论

TOP 榜单

文章

根据另一列中的一些多个过滤器值匹配列中的子字符串并使用 Pandas 聚合计数

根据另一列中的一些多个过滤器值匹配列中的子字符串并使用 Pandas 聚合计数

UITableView的项目向下滚动后更改颜色，然后快速备份

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Mac OS X更新后的GRUB 2问题

验证REST API参数

Java Eclipse中的错误13，如何解决？

带有错误“ where”条件的查询如何返回结果？

ggplot：对齐多个分面图-所有大小不同的分面

尝试反复更改屏幕上按钮的位置 - kotlin android studio

如何从视图一次更新多行（ASP.NET - Core）

计算数据帧中每行的NA

蓝屏死机没有修复解决方案

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

离子动态工具栏背景色

VB.net将2条特定行导出到DataGridView

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

在Windows 7中无法删除文件（2）

python中的boto3文件上传

当我尝试下载 StanfordNLP en 模型时，出现错误

Node.js中未捕获的异常错误，发生调用