我有以下数据集,在该数据集中我试图对每列中的行值进行排序,但未能找到执行该操作的有效方法。我希望有人能够以一种更优化的排序方式指出我:
|Column_to_Sort|Desired_Output| | a, x, z,c | a, c, x, z | | ball, apple | apple, ball |
本质上,我试图重新排列Column_to_sort
字母顺序的项目列表,并用逗号分隔。
我编写了以下代码来执行该操作,但是我不认为这是执行该操作的最佳方法:
def sort_val(x):
String_ = x.split(",")
String_.sort()
return (String_)
df['Desired_Output'] = df['Column_to_Sort'].apply(lambda x: sort_val(x))
通过使用dot
和解决get_dummies
s=df['Column_to_Sort'].str.get_dummies(', ').sort_index(axis=1)
s.dot(s.columns+',').str[:-1]
Out[547]:
0 a,c,x,z
1 apple,ball
dtype: object
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句