熊猫分配回用notnull（）过滤的系列

本杰明·博德

各位开发人员大家好，

我目前正在学习熊猫，仍在努力寻找如何分配值的方法，这些值我已转换为特定类型，例如，返回到原始数据框。

更具体地说，我有这个数据框：

     id         A       B
0   50000    12413     32885.0
1   50001     2040     43737.0
3   50002     2040     28015.0
4   50003     2040      NaN
5   50004     2040     28565.0

我的目标是将列转换B为整数，但将NaN值保持不变，所以不行fillna(0)。我想要这个：

     id         A       B
0   50000    12413     32885
1   50001     2040     43737
3   50002     2040     28015
4   50003     2040      NaN
5   50004     2040     28565

我做到了print(df.loc[df['B'].notnull(), 'B'].astype('int'))，它奏效了。

但是，如果我尝试将其分配回数据帧：

df.loc[df['B'].notnull(), 'B'] = df.loc[df['B'].notnull(), 'B'].astype('int')

我仍然得到原始的，未转换的数据。所以我似乎做错了分配，但我不知道如何正确执行分配。帮助将不胜感激！

使用大熊猫时，请避免NaN与整数结合

除非您有充分的理由，否则请避免这种做法。原因是pandas仅允许使用连续内存块中的数组进行矢量化计算。这只是与同类型的数据可能，例如，一系列的类型int，float，datetime，但不是 object。

NaN被考虑float。因此，默认情况下，将带NaN力的整数组合起来pandas会将整个系列向上转换为float。这会增加内存使用量，但是对于大多数用例而言，这不是问题。

如果要NaN与整数结合，则需要使用创建一个序列dtype=object，并pandas使用一系列指针。这在计算上和存储器上是昂贵的。除非绝对必要，否则不要这样做。

但是，如果您只是必须...

您可以object先将转换为，然后再将非NaN元素转换为整数：

df['B'] = df['B'].astype(object)

如上所述，您要pandas/numpy为系列中的每个项目使用一个指针。您不妨开始使用列表。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-11-23

我来说两句

0 条评论

登录后参与评论

上一篇：在熊猫中使用lambda函数后，索引列消失了

熊猫如何过滤系列

如何过滤熊猫系列？

为熊猫系列分配列名

熊猫系列的Python多重分配

值之间的熊猫系列过滤

用熊猫过滤

用列表填充熊猫系列

熊猫将值分配给已过滤的数据框/系列。为什么不一致？

为熊猫系列花车分配日期

根据条件分配熊猫系列中的值？

熊猫过滤器系列清单

熊猫系列过滤器DataFrame

如何根据条件过滤熊猫系列值

根据.sum（）总数过滤熊猫系列

用条件过滤熊猫 df

熊猫：用均值填补系列中的空白

用熊猫创建日期范围系列

用熊猫系列中的值填充列

熊猫：将值分配回未知列

如何将groupby结果分配给熊猫系列

将大熊猫系列分配给groupby操作

拆分熊猫系列并将其分配到单独的列中

熊猫将系列分配给groupby结果

使用嵌套的defaultdict重新分配熊猫系列值

在熊猫中，如何根据值的类型过滤系列？

熊猫系列链：过滤布尔值

根据一系列熊猫过滤行

熊猫：按发生次数过滤分组的系列

按日期或匿名函数过滤熊猫系列

TOP 榜单

文章

熊猫分配回用notnull（）过滤的系列

熊猫分配回用notnull（）过滤的系列

蓝屏死机没有修复解决方案

计算数据帧中每行的NA

UITableView的项目向下滚动后更改颜色，然后快速备份

Node.js中未捕获的异常错误，发生调用

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

Linux的官方Adobe Flash存储库是否已过时？

验证REST API参数

ggplot：对齐多个分面图-所有大小不同的分面

Mac OS X更新后的GRUB 2问题

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

带有错误“ where”条件的查询如何返回结果？

用日期数据透视表和日期顺序查询

VB.net将2条特定行导出到DataGridView

如何从视图一次更新多行（ASP.NET - Core）

Java Eclipse中的错误13，如何解决？

尝试反复更改屏幕上按钮的位置 - kotlin android studio

离子动态工具栏背景色

应用发明者仅从列表中选择一个随机项一次

当我尝试下载 StanfordNLP en 模型时，出现错误

python中的boto3文件上传

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID