在熊猫数据框中按计数分组

Daven1 发表于 Dev

达文1

在熊猫数据框中，我想创建两个新列来计算相同值的出现次数和第三列来计算比率

比率 = count_occurrence_both_columns /count_occurrence_columnA *100

df = pd.DataFrame({"column A": ["Atlanta", "Atlanta", "New York", "New York","New York"], "column B": ["AT", "AT" , "NY", "NY", "AT"]}) df

柱子	B列	出现_columnA	出现_both_columns	比率
亚特兰大	在	2	2	100%
亚特兰大	在	2	2	100%
纽约	新的	3	2	66.66%
纽约	新的	3	2	66.66%
纽约	在	3	1	33.33%

莱昂纳多·卡尔德隆

首先，您可以创建一个字典，将键作为 A 列的唯一值，将值作为计数。

>>> column_a_mapping = df['column A'].value_counts().to_dict()
>>> column_a_mapping
>>> {'New York': 3, 'Atlanta': 2}

然后，您可以创建一个将两列合并的新列，以便具有与上述相同的值计数字典。

>>> df['both_columns'] = (
        df[['column A', 'column B']]
        .apply(lambda row: '_'.join(row), axis=1)
    )

>>> both_columns_mapping = df['both_columns'].value_counts().to_dict()
>>> both_columns_mapping
>>> {'New York_NY': 2, 'Atlanta_AT': 2, 'New York_AT': 1}

一旦您拥有唯一值计数，您就可以简单地使用该replace pd.Series方法。

>>> df['count_occurrence_both_columns'] = df['both_columns'].replace(both_columns_mapping)
>>> df['count_occurrence_columnA'] = df['column A'].replace(column_a_mapping)

最后，您可以删除合并了两列的列，然后使用以下命令创建比率列：

>>> df['ratio'] = df['count_occurrence_both_columns'] / df['count_occurrence_columnA'] * 100
>>> df.drop('both_columns', axis=1, inplace=True)

您应该获得此数据框：

A列	B栏	count_occurrence_columnA	count_occurrence_both_columns	比率
亚特兰大	在	2	2	100.000000
亚特兰大	在	2	2	100.000000
纽约	新的	3	2	66.666667
纽约	新的	3	2	66.666667
纽约	在	3	1	33.333333

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-09-14

我来说两句

0 条评论

登录后参与评论

上一篇：即使在使用限定符注释时，Dagger/DuplicateBindings 也具有通用接口

熊猫数据框。按值和计数分组

熊猫，按计数分组并将计数添加到原始数据框？

熊猫数据框，按日期/月份分组，按类别计数

按熊猫数据框中的字段分组

在熊猫数据框中按条件分组

熊猫数据框按两列分组，计数和总和

数据框按月计数分组

将熊猫数据框列中的单词按另一列分组以获得频率/计数

如何按熊猫数据框列中的前 2 个单词分组并计数？

在MySQL中按计数分组输出？

在XQuery中按计数分组

pandas 数据框按列分组，并根据计数分别更新另一列的行

熊猫：按列和存储计数分组

熊猫分组并计数，然后按分组大小对整个数据框进行升序排序？

如何在熊猫中按数据框分组并保留列

在数据框熊猫中按最大期限分组的问题

在熊猫数据框中按纪元时间嵌套分组

在熊猫数据框中按列计数出现的次数

数据框熊猫的分组依据值计数

按总计数分组后过滤数据

熊猫数据框显示按分组依据和汇总计数

在 postgresql 中按组合计数分组

按计数分组以获取集合中的布尔值

熊猫数据框按顺序分组

熊猫数据框按特定值分组

熊猫数据框按多列分组

绘制按列分组的熊猫数据框

熊猫数据框按列位置分组

熊猫数据框按列表分组

TOP 榜单

文章

在熊猫数据框中按计数分组

在熊猫数据框中按计数分组

UITableView的项目向下滚动后更改颜色，然后快速备份

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Mac OS X更新后的GRUB 2问题

验证REST API参数

Java Eclipse中的错误13，如何解决？

带有错误“ where”条件的查询如何返回结果？

ggplot：对齐多个分面图-所有大小不同的分面

尝试反复更改屏幕上按钮的位置 - kotlin android studio

如何从视图一次更新多行（ASP.NET - Core）

计算数据帧中每行的NA

蓝屏死机没有修复解决方案

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

离子动态工具栏背景色

VB.net将2条特定行导出到DataGridView

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

在Windows 7中无法删除文件（2）

python中的boto3文件上传

当我尝试下载 StanfordNLP en 模型时，出现错误

Node.js中未捕获的异常错误，发生调用