我有一个具有100万行和5列的pandas Dataframe。
np.shape(y)
(1037889, 5)
列的值都是0或1。看起来像这样:
y.head()
a, b, c, d, e
0, 0, 1, 0, 0
1, 0, 0, 1, 1
0, 1, 1, 1, 1
0, 0, 0, 0, 0
我想要一个具有100万行和1列的数据框。
np.shape(y)
(1037889, )
该列只是连接在一起的5列。
New column
0, 0, 1, 0, 0
1, 0, 0, 1, 1
0, 1, 1, 1, 1
0, 0, 0, 0, 0
我一直在尝试不同的事物一样merge
,concat
,dstack
,等...但似乎无法弄清楚这一点。
如果您希望新列将所有数据都连接到字符串,那么apply()函数是一个很好的例子:
>>> df = pd.DataFrame({'a':[0,1,0,0], 'b':[0,0,1,0], 'c':[1,0,1,0], 'd':[0,1,1,0], 'c':[0,1,1,0]})
>>> df
a b c d
0 0 0 0 0
1 1 0 1 1
2 0 1 1 1
3 0 0 0 0
>>> df2 = df.apply(lambda row: ','.join(map(str, row)), axis=1)
>>> df2
0 0,0,0,0
1 1,0,1,1
2 0,1,1,1
3 0,0,0,0
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句