我的数据集中的一列具有如下存储的“关键字”值:
monster|dna|tyrannosaurus rex|velociraptor|island
我想在 (|)管道上拆分每个关键字并将其存储为新行,以便稍后使用groupby查看基于关键字的相关性。
我得到的最远的是:
dfn = df['keywords'].str.split('|',expand=True)
但这将它们存储为新列,而不是新行,并且仅将这些值存储在新数据框中。我仍然需要将它附加回原始数据帧,然后删除包含关键字簇的原始行。
您可以stack
在之后添加split
dfn = df['keywords'].str.split('|',expand=True).stack()
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句