如何跨熊猫的多个数据框列“选择不同”?

乔迪:

我正在寻找一种等效于SQL的方法

SELECT DISTINCT col1, col2 FROM dataframe_table

pandas sql比较与无关distinct

.unique() 仅适用于单个列,因此我想我可以合并这些列,或将它们放在列表/元组中并进行比较,但这似乎是熊猫应该以更原生的方式进行的操作。

我是否缺少明显的东西,或者没有办法做到这一点?

乔里斯:

您可以使用该drop_duplicates方法来获取DataFrame中的唯一行:

In [29]: df = pd.DataFrame({'a':[1,2,1,2], 'b':[3,4,3,5]})

In [30]: df
Out[30]:
   a  b
0  1  3
1  2  4
2  1  3
3  2  5

In [32]: df.drop_duplicates()
Out[32]:
   a  b
0  1  3
1  2  4
3  2  5

subset如果只想使用某些列来确定唯一性,则也可以提供关键字参数。请参阅文档字符串

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章