Pandas DataFrame列串联

脖子胡子

我有一个具有100万行和5列的pandas Dataframe。

np.shape(y)  
(1037889, 5)

列的值都是0或1。看起来像这样:

y.head()  
a, b, c, d, e  
0, 0, 1, 0, 0  
1, 0, 0, 1, 1  
0, 1, 1, 1, 1  
0, 0, 0, 0, 0

我想要一个具有100万行和1列的数据框。

np.shape(y)  
(1037889, )

该列只是连接在一起的5列。

New column  
0, 0, 1, 0, 0  
1, 0, 0, 1, 1  
0, 1, 1, 1, 1  
0, 0, 0, 0, 0

我一直在尝试不同的事物一样mergeconcatdstack,等...但似乎无法弄清楚这一点。

罗曼·佩卡(Roman Pekar)

如果您希望新列将所有数据都连接到字符串,那么apply()函数是一个很好的例子:

>>> df = pd.DataFrame({'a':[0,1,0,0], 'b':[0,0,1,0], 'c':[1,0,1,0], 'd':[0,1,1,0], 'c':[0,1,1,0]})
>>> df
   a  b  c  d
0  0  0  0  0
1  1  0  1  1
2  0  1  1  1
3  0  0  0  0
>>> df2 = df.apply(lambda row: ','.join(map(str, row)), axis=1)
>>> df2
0    0,0,0,0
1    1,0,1,1
2    0,1,1,1
3    0,0,0,0

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章