在熊猫中逐列减元素

马丁·约达诺夫(George Yordanov Georgiev)

我有以下数据框:

frame=pd.DataFrame({"col1":[1,5,9,4,7,3],"col2":[5,8,7,9,3,4],"col3":[3,4,2,7,9,1],
          "col4":[2,4,7,4,9,0],"col5":[3,4,5,2,1,1],"col6":[8,7,5,4,1,2]})

结果如下:

    col1    col2    col3    col4    col5    col6
0     1       5      3       2        3       8
1     5       8      4       4        4       7
2     9       7      2       7        5       5
3     4       9      7       4        2       4
4     7       3      9       9        1       1
5     3       4      1       0        1       2

我想创建一个新的数据框,其区别在于col1和col2,col3和col4以及col5和col6

预期的输出是这样的:

    col1-col2   col3-col4   col5-col6
0      -4           1           -5
1      -3           0           -3
2       2          -5            0
3      -5           3           -2
4       4           0            0
5      -1           1           -1

提前致谢

耶斯列尔

如果许多列使用一般解决方案-选择成对和不成对的列,转换为numpy数组,并DataFrame通过构造方法创建新列

#pandas 0.24+
arr = frame.iloc[:, ::2].to_numpy() - frame.iloc[:, 1::2].to_numpy()
#pandas below
#arr = frame.iloc[:, ::2].values - frame.iloc[:, 1::2].values

c = [f'{a}-{b}' for a, b in zip(frame.columns[::2], frame.columns[1::2])]
df = pd.DataFrame(arr, columns=c)
print (df)
   col1-col2  col3-col4  col5-col6
0         -4          1         -5
1         -3          0         -3
2          2         -5          0
3         -5          3         -2
4          4          0          0
5         -1          1         -1

如果性能很重要,请首先转换为numpy数组,存储为变量,然后进行索引:

#pandas 0.24+
arr = frame.to_numpy()
#pandas below
#arr = frame.values
c = [f'{a}-{b}' for a, b in zip(frame.columns[::2], frame.columns[1::2])]
df = pd.DataFrame(arr[:, ::2] - arr[:, 1::2], columns=c)

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章