我有一个名称的数据集(csv 文件),其中列出了名称以及使用该名称的人数、他们的“等级”和名称本身。
我正在寻找一种方法,可以在 excel 中理想地将所有名称分成单行 - 但也许熊猫中的某些东西是一种选择。
问题是许多行包含多个逗号分隔的名称。
数据看起来像这样。
rank | number of occurrences | name
1 | 10000 | marie
2 | 9999 | sophie
3 | 9998 | ellen
...
...
50 | 122 | jude, allan, jaspar
我希望将每个名称与对应的出现次数一起放在单独的行上。排名重复就好了。
像这样的东西
rank | number of occurrences | name
1 | 10000 | marie
2 | 9999 | sophie
3 | 9998 | ellen
..
...
50 | 122 | jude
50 | 122 | allan
50 | 122 | jaspar
采用 df.explode()
df.assign(name=(df.name.str.split(','))).explode('name')
工作方式
df.name=# Equivalent of df.assign(name=
df.name.str.split(',')#puts the names in list
df.explode('name')# Disintegrates the multiple names into one per row
rank number of occurrences name
0 1 10000 marie
1 2 9999 sophie
2 3 9998 ellen
3 50 122 jude
3 50 122 allan
3 50 122 jaspar
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句