我有一个包含类似这样的字符串列
Col1 |
---|
ind1,ind2,ind3 |
ind1,ind5,ind3 |
ind2,ind3,ind5,ind4 |
我想将其拆分为以下列:
in_1 | in_2 | in_3 | in_4 | in_5 |
---|---|---|---|---|
ind1 | ind2 | ind3 | ||
ind1 | ind3 | ind5 | ||
ind2 | ind3 | ind4 | ind5 |
using.str.rsplit(',', expand=True)
不会在同一列中对相同的字符串进行排序。
使用带有分隔符的 df.column.str.get_dummies 作为“,”
import pandas as pd
df = pd.DataFrame({
"col1" : ["ind1,ind2,ind3", "ind1,ind5,ind3", "ind2,ind3,ind5,ind4"]
})
df.head()
# output
col1
0 ind1,ind2,ind3
1 ind1,ind5,ind3
2 ind2,ind3,ind5,ind4
df = pd.concat([df,df.col1.str.get_dummies(sep = ",")], axis =1)
df
# output
col1 ind1 ind2 ind3 ind4 ind5
0 ind1,ind2,ind3 1 1 1 0 0
1 ind1,ind5,ind3 1 0 1 0 1
2 ind2,ind3,ind5,ind4 0 1 1 1 1
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句