pandas 数据框混淆了 .count 和 .sum 之间的区别

亚当施罗德

在下面的数据框中,通过电子邮件和一次电话联系了亚当两次。如果我使用 sum() 来计算电子邮件的总使用量,我会得到正确的结果:2。但是如果我使用 count(),adam 会得到 3。为什么会发生这种情况?.count() 不区分 True 和 False 布尔值吗?

df = pd.DataFrame ({'Name':['adam','ben','adam','adam','ben'], 'Type' ['Email', 'Phone', 'Email','Phone','Phone']}, index =[0,1,2,3,4])

df.groupby('Name')['Type'].apply(lambda x: x.isin(['Email']).sum())
df.groupby('Name')['Type'].apply(lambda x: x.isin(['Email']).count())
特德·彼得鲁

count方法的技术定义是计算非缺失值。由于您的所有值都不会丢失,因此它只返回每个组的行数。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

Pandas DataFrame:滚动和扩展功能之间的区别

Python Pandas-“ loc”和“ where”之间的区别?

numpy var()和pandas var()之间的区别

Pandas中map,applymap和apply方法之间的区别

数据库和架构之间的区别

数据存储和主机存储之间的区别?

位图和位图数据之间的区别

目标c中方法混淆和类别之间的区别

MongoDB中count()和find()。count()之间的区别

R中“数据”和“值”之间的区别

数据框列的套用和套用之间的区别?

大型数据集上sum(column_name),sum(1)和count(*)之间的巨大性能差异

MySQL-SUM和COUNT有什么区别?

MIPS和ARM数据路径之间的区别

oracle中count(1)和count(*)之间的区别

sumbool和sum之间的区别

熊猫的sum()和count()有什么区别?

数据框的$和[]函数之间的区别

将列添加到Pandas数据框时如何避免列和DatetimeIndex之间的混淆

混淆和预测之间的区别

如何每月获取SUM和COUNT数据?

混淆和混淆之间的区别?再安全吗?

select count(*)from和select count('quoted string')之间的区别

混淆了HTML实体代码和原始代码之间的区别

在 Pandas 和 Sum 列中加入数据框

Pandas:从 groupby 创建一个数据框并在不同的列上应用 sum 和 mean

Groupby 和 count() 带有别名和“正常”数据框:pyhton pandas 与 mssql

在表中查找 NaN 行时 count() 和 sum() 之间的区别

MySQL 中 SUM() 和 COUNT() 的区别