我试图学习python,但是我陷入了一个问题。我需要随机选择一个DataFrame的X行,而我正在用进行操作sample.(frac=X)
,但就我而言,我可以有重复的行,sample()
而不要这样做。
这是我在做什么:
dfSub = dataFrame.groupby(self.column, as_index=False).apply(lambda x: x.sample(frac=self.percentage)).reset_index(drop=True)
如何随机选择有重复行的机会?
您想要的就是带有替换的随机采样,即从骨灰盒中拉出一个球之后,将其放回骨灰盒中,以便再次进行绘制。
您只需要将replace
参数设置为True
:
lambda x: x.sample(frac=self.percentage, replace=True)
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句