实现“ df [m] = df [x] + df [y] + df [z]”的更好方法

QM.py 发表于 Dev

质量管理

我想得到三列的总和，我采用的方法如下：

In [14]:

a_pd = pd.DataFrame({'a': np.arange(3),
                     'b': [5, 7, np.NAN],
                     'c': [2, 9, 0]})
a_pd
Out[14]:
a   b   c
0   0   5.0 2
1   1   7.0 9
2   2   NaN 0
In [18]:

b_pd = a_pd['a'] + a_pd['b'] + a_pd['c']
b_pd
Out[18]:
0     7.0
1    17.0
2     NaN
dtype: float64

但是正如您所看到的，NaN不能被排除。所以我尝试了np.add()，但是出了点问题：

In [19]:

b_pd = a_pd[['a', 'b', 'c']].apply(np.add, axis=1)
b_pd
---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-19-f52f400573b4> in <module>()
----> 1 b_pd = a_pd[['a', 'b', 'c']].apply(np.add, axis=1)
      2 b_pd

F:\anaconda\lib\site-packages\pandas\core\frame.pyc in apply(self, func, axis, broadcast, raw, reduce, args, **kwds)
   4045 
   4046         if isinstance(f, np.ufunc):
-> 4047             results = f(self.values)
   4048             return self._constructor(data=results, index=self.index,
   4049                                      columns=self.columns, copy=False)

ValueError: invalid number of arguments

因此，我想知道您如何解决此错误。

艾汉

您可以使用DataFrame的sum方法：

a_pd.sum(axis=1)
Out: 
0     7.0
1    17.0
2     2.0
dtype: float64

如果要指定列：

a_pd[['a', 'b', 'c']].sum(axis=1)
Out: 
0     7.0
1    17.0
2     2.0
dtype: float64

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-05-8

我来说两句

0 条评论

登录后参与评论

上一篇：有效选择具有给定概率的随机矩阵索引

dplyr等于DF [DF == X] <-Y

df [x]，df [[x]]，df ['x']，df [['x']]和df.x之间的差异

FOR循环如何实现empy df

Pandas：df['A'] == df['B'] 或 df['B'] == [] 的行数

df[df['col a']] 和 df['col a'] 的区别？

在R中分配df $ COLUMN [x] = df2 $ COLUMN [y]的问题

如何从熊猫df中的x列中提取值，其中df中的y列== list（i）

Вернуть df, содержащий точки в радиусе - python

df -h 和 df -kh？

遍历df并创建新的df

从单个 df 创建多个 df

将 N*M DF 转换为 1D DF

熊猫df.loc [z，x] = y如何提高速度？

PySpark 基于来自不同 df 的列过滤 df 的最佳方法

将 2 个数据框与 df.x 中的 dateTime 列在 df.y 中的 dateStart dateEnd 上过滤？

df.where（）和df [（df [] ==））在熊猫，python中的区别

df，df -h和df -l之间的差异

如何根据条件从DF创建DF

转置pyspark df并取回pyspark df

用快捷方式替换df <-df％>％...

df.at或df.loc的控制行为

熊猫传播DF到指标DF

熊猫df.to_excel用于多个df？

修改 df 后更新 df 变量列表

Python：Df 之前从 Df 获取数据

熊猫的速度df.loc [x，'column']

子集（df，！重复（x））做什么？

如何合并两个数据帧的x和y行，但列应并排（df2 $ y）并排（df1 $ x）？

df.to_latex（）的格式

TOP 榜单

文章

实现“ df [m] = df [x] + df [y] + df [z]”的更好方法

实现“ df [m] = df [x] + df [y] + df [z]”的更好方法

隐藏发件人没有短信PHP

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

用日期数据透视表和日期顺序查询

flask-admin 如何自定义删除按钮

在浏览器中请求URL时会发生什么？

材质UI垂直滑块。如何改变在垂直材料UI滑块导轨的厚度（反应）

为什么PlusShare.Builder setRecipients方法不起作用？

OS X-为什么我需要打开WiFi才能确定最近的位置

在Windows 7中无法删除文件（2）

android 背部按下

Swift如何使用Base64Url编码JWT标头和有效负载之类的json对象

PyQt4.QtCore模块无法向sip模块注册

用白色图像隐藏Android Studio中的所有textView

为什么随机森林中的平均降低基尼系数取决于人口规模？

应用发明者仅从列表中选择一个随机项一次

正则表达式，用于查找所有以任何字母开头和数字开头的文件

ArgumentError：错误＃2109：在场景默认设置中未找到默认的帧标签

sshd AllowGroups组未授予访问权限

jQuery无限滚动固定div中的滚动

无法加载文件或程序集System.Runtime.CompilerServices.Unsafe

Jqgrid：多级别组摘要