如何在熊猫中一起使用distinct和where子句？

最棒的

我有一个数据框和列表如下

op1 = pd.DataFrame({
'subject_id':[1,1,2,3,4,4,5],
'iid': [21,22,23,24,26,26,27],
'los':[121,122,123,124,111,111,131],
'area':['a','a','b','c','d','d','f'],
'date' : ['1/1/2017','1/2/2017','1/3/2017','1/4/2017','1/6/2017','1/6/2017','1/8/2109'],
'val' :[5,10,5,16,26,26,7]
 })

sub_list = [1,2,3,4]

我想检查是否subject_id从sub_list存在op1。如果存在，然后拿到distinct从列中的值los，iid，area为subject_id（之间找差距subject_id 1 and 4（其中有重复）

我尝试了以下内容，但不能有多列

op1[op1['subject_id'].isin(sub_list)] # how to use distinct records here?

我必须将此应用于一百万条记录。因此，任何优雅高效的解决方案都是有帮助的

我正在寻找类似的东西

select distinct subject_id, iid,los, area from op1
where subject_id in [sub_list]

我希望我的输出如下所示

GZ0

如果要仅返回选定的列，请执行以下操作：

result = op1.loc[op1["subject_id"].isin(sub_list), ["subject_id", "los", "iid", "area"]].drop_duplicates()

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-20

我来说两句

0 条评论

登录后参与评论

如何在Apache Beam中一起使用MapElements和KV？

您如何在Groovy中一起使用GroupBy和Sum？

如何在SQL Server查询中一起使用LIKE和NOT LIKE

如何在angular 1中一起使用ng-if和ng-options

如何在SQL中一起使用数据透视和分组依据？

如何在PHP中一起使用复选框和输入类型编号

如何在CodeIgniter中将JOIN与get_where子句一起使用

如何在Python中一起使用filter，group by和agg函数

如何在Google表格中一起使用to_date和IFERROR？

如何在while和foreach循环中一起使用PHP和MySQL？

如何在Redis中一起使用复制和分片？

如何在SQL Server中一起使用相等和不相等

在MS Excel IF函数中一起使用AND和OR子句

如何在Bash中一起使用watch和jobs命令？

如何在SQL中一起使用IN子句和AND子句

如何在Scrapy中一起使用http和https代理？

如何在Verilog中一起使用inout和reg

如何在SQL Server中一起使用count，case和Distinct

我如何在React中一起使用'update'和setState（prevState）？

如何在for循环中一起使用innerHTML和ejs？

如何在 Swift iOS 中一起使用 UITableView 和 NSLink？

如何在laravel中一起使用whereBetween和like运算符？

我有问题在 sql 中一起使用 like 和 where 子句

如何在输入中一起使用 :value 和 v-model

如何在 Elastic search 聚合中一起做 sum + cardinality，比如 sum(distinct target) 和 distinct( sum(amount)))

如何在 Pandas 中一起使用 groupby、select、count(*) 和 SQL 的 where 命令

如何在 MongoDB 中一起使用 match 和 sum？

如何在python中一起使用.join()和.format()

JPA：在 where 子句和 Case 语句中一起使用列表 - 有没有办法循环？

TOP 榜单

文章

如何在熊猫中一起使用distinct和where子句？

如何在熊猫中一起使用distinct和where子句？

Android Studio Kotlin：提取为常量

计算数据帧R中的字符串频率

如何使用Redux-Toolkit重置Redux Store

http：// localhost：3000 /＃！/为什么我在localhost链接中得到“＃！/”。

如何使用tweepy流式传输来自指定用户的推文（仅在该用户发布推文时流式传输）

TreeMap中的自定义排序

TYPO3：将 Formhandler 添加到新闻扩展

遍历元素数组以每X秒在浏览器上显示

在Ubuntu和Windows中，触摸板有时会滞后。硬件问题？

警告消息：在matrix（unlist（drop.item），ncol = 10，byrow = TRUE）中：数据长度[16]不是列数的倍数[10]>？

无法连接网络并在Ubuntu 14.04中找到eth0

将辅助轴原点与主要轴对齐

我可以ping IPv6但不能ping IPv4

在Jenkins服务器中使用Selenium和Ruby进行的黄瓜测试失败，但在本地计算机中通过

提交html表单时为空

使用C ++ 11将数组设置为零

如果从DB接收到的值为空，则JMeter JDBC调用将返回该值作为参数名称

尝试在Dell XPS13 9360上安装Windows 7时出错

如何在R中转置数据

无法使用 envoy 访问 .ssh/config

未捕获的SyntaxError：带有Ajax帖子的意外令牌u