大熊猫的分组比和计算比率

阿尔帕三角洲

我有以下代码按年龄计算转化率（“转化”列具有两个值1，分别表示转化成功和0失败）。但是我想知道是否有更“优雅”的方式来做到这一点？

import pandas as pd
import numpy as np

np.random.seed(30)

### MAKE PSEUDODATA
start_date,end_date = '1/1/2015','12/31/2018'
date_rng = pd.date_range(start= start_date, end=end_date, freq='D')
length_of_field = date_rng.shape[0]
df = pd.DataFrame(date_rng, columns=['date'])
df['age'] = np.random.randint(18,100,size=(len(date_rng)))
df['conversion'] = np.random.randint(0,2,size=(len(date_rng)))

### ACTUAL CONVERSION CALCULATION 
conversion_by_age = df.groupby(by='age')['conversion'].agg(['count','sum'])
conversion_by_age['rate'] = df.groupby(by='age')['conversion'].sum()/df.groupby(by='age')['conversion'].count()
print(conversion_by_age)

塞利乌斯·斯汀格（Celius Stingher）

groupby定义后，实际上无需执行更多次。我将使用div运算符代替/series / df除法。我将更改最后两行并获得相同的结果：

conversion_by_age['rate'] = conversion_by_age['sum'].div(conversion_by_age['count'])
print(conversion_by_age)

另一种方法，只取1行代码，该rate列可以被内计算出的groupby使用lambda：

conversion_by_age = df.groupby(by='age').apply(lambda x: x['conversion'].sum() / x['conversion'].count())

时间比较：

最后，即使lambda是一个衬板，它也比使用慢得多.div()。这些是运行1000次的时间：

方法1时间：0.00981671929359436s +/- 0.0007387502003829031
方法2时间：0.015887546062469483 +/- 0.0014185150269994534

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-23

我来说两句

0 条评论

登录后参与评论

以大熊猫分组，计算均值

大熊猫的分组和转换

大熊猫分组

大熊猫根据按列分组的指标计算差异

大熊猫的复杂分组

大熊猫分组作业

如何在大熊猫中进行分组和变形

如何在大熊猫中分组和转化

按月份名称和年份对大熊猫输出分组

大熊猫：如何进行分组和联合

如何在大熊猫中分组和聚集

如何用大熊猫中的groupby计算绝对和？

大熊猫，申请后保持分组

大熊猫更快的分组比：值列表

大熊猫分组依据的价值计数

使用大熊猫的分组移动

对每个索引应用大熊猫分组比

按大熊猫分组筛选

大熊猫分组排名前X％

大熊猫的分组依据专栏

计算日期的大熊猫列清单

如何计算大熊猫的人口？

计算累积总和大熊猫

大熊猫中的条件成对计算

计算大熊猫的旅行时间

计算大熊猫的条纹而不适用

大熊猫如何计算指数？

计算大熊猫的尾随方差

计算大熊猫的连续状况

TOP 榜单

文章

大熊猫的分组比和计算比率

大熊猫的分组比和计算比率

时间比较：

Android Studio Kotlin：提取为常量

IE 11中的FormData未定义

计算数据帧R中的字符串频率

如何在R中转置数据

如何使用Redux-Toolkit重置Redux Store

Excel 2016图表将增长与4个参数进行比较

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

未捕获的SyntaxError：带有Ajax帖子的意外令牌u

OpenCv：改变 putText() 的位置

ActiveModelSerializer仅显示关联的ID

算术中的c ++常量类型转换

如何开始为Ubuntu开发

将加号/减号添加到jQuery菜单

去噪自动编码器和常规自动编码器有什么区别？

获取并汇总所有关联的数据

OpenGL纹理格式的颜色错误

在 React Native Expo 中使用 react-redux 更改另一个键的值

http：// localhost：3000 /＃！/为什么我在localhost链接中得到“＃！/”。

TreeMap中的自定义排序

Redux动作正常，但减速器无效

如何对treeView的子节点进行排序