在表中查找 NaN 行时 count() 和 sum() 之间的区别

奥利弗

我有这个表,值, - 一些值是 NaN:

ID   Value1    Value2    Value3
12   "filled"  "filled"   NaN
13   "filled"  "filled"   "filled"
14   "filled"  "filled"   NaN

我必须找到 Value3 中缺少的总行数 -

我的代码是

values_missing = values["Value3"].isnull().count()

但是这返回的是表中的总行数,这显然是错误的

玩了一圈,我发现:

values_missing = values["Value3"].isnull().sum()

返回正确答案,但我很难理解为什么

为什么不使用 count(),当没有 sum() 的时候,只有数字或行数?

阿尔卡迪乌什

因为pandas.DataFrame.count我们有:

在此处输入图片说明

所以在你的情况下:

values["Value3"].isnull()

0     True
1    False
2     True

它为我们提供了三个非 NA 事件。然后如果你.count()在最后加上,你得到的总数是 3。

当您添加.sum()时,它会为.isnull()函数求和 True 值

在你的情况下:

values["Value3"].isnull().sum()

2

values["Value3"].notnull().sum()

1

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章