根据其他列的条件提取数据框的行子集

road_to_quantdom

我有一个dataframe像下面这样的：

x <- data.table(Tickers=c("A","A","A","B","B","B","B","D","D","D","D"),
                Type=c("put","call","put","call","call","put","call","put","call","put","call"),
                Strike=c(35,37.5,37.5,10,11,11,12,40,40,42,42),
                Other=sample(20,11))

    Tickers Type Strike Other
 1:       A  put   35.0     6
 2:       A call   37.5     5
 3:       A  put   37.5    13
 4:       B call   10.0    15
 5:       B call   11.0    12
 6:       B  put   11.0     4
 7:       B call   12.0    20
 8:       D  put   40.0     7
 9:       D call   40.0    11
10:       D  put   42.0    10
11:       D call   42.0     1

我正在尝试分析数据的子集。我想获取的子集是ticker和strike相同的数据。但是我也只想在下存在aput和acall时获取这些数据type。以上面的数据为例，我想返回以下结果：

x[c(2,3,5,6,8:11),]

   Tickers Type Strike Other
1:       A call   37.5     5
2:       A  put   37.5    13
3:       B call   11.0    12
4:       B  put   11.0     4
5:       D  put   40.0     7
6:       D call   40.0    11
7:       D  put   42.0    10
8:       D call   42.0     1

我不确定执行此操作的最佳方法是什么。我的思考过程是我应该创建另一个列向量，例如

x$id <- paste(x$Tickers,x$Strike,sep="_")

然后使用此向量仅提取存在多个ID的值。

x[x$id %in% x$id[duplicated(x$id)],]

   Tickers Type Strike Other     id
1:       A call   37.5     5 A_37.5
2:       A  put   37.5    13 A_37.5
3:       B call   11.0    12   B_11
4:       B  put   11.0     4   B_11
5:       D  put   40.0     7   D_40
6:       D call   40.0    11   D_40
7:       D  put   42.0    10   D_42
8:       D call   42.0     1   D_42

我不确定这样做的效率如何，因为我的实际数据包含更多行。同样，该解决方案不检查type存在一个put和一个的条件call。

标题的措词可能会好很多，我很抱歉

编辑：：：已签出该帖子查找所有重复的行，包括“带有较小下标的元素”

我也可以使用以下解决方案：

x$id <- paste(x$Tickers,x$Strike,sep="_")
x[duplicated(x$id) | duplicated(x$id,fromLast=T),]

迈克·H

您可以尝试类似：

x[, select := (.N >= 2 & all(c("put", "call") %in% unique(Type))), by = .(Tickers, Strike)][which(select)]

#   Tickers Type Strike Other select
#1:       A call   37.5    17   TRUE
#2:       A  put   37.5    16   TRUE
#3:       B call   11.0    11   TRUE
#4:       B  put   11.0    20   TRUE
#5:       D  put   40.0     1   TRUE
#6:       D call   40.0    12   TRUE
#7:       D  put   42.0     6   TRUE
#8:       D call   42.0     2   TRUE

另一个想法可能是合并：

x[x, on = .(Tickers, Strike), select := (length(Type) >= 2 & all(c("put", "call") %in% Type)),by = .EACHI][which(select)]

我不确定如何解决分组方式，因为您要确保每个分组都具有“通话”和“发出”权限。我当时正在考虑使用键，但是还不能合并“调用” /“放置”方面。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-11-23

我来说两句

0 条评论

登录后参与评论

上一篇：AttributeError：即使安装了opencv-contrib，“模块”对象也没有属性“面”错误

根据其他数据框的条件提取数据框的元素

如何根据其他列和其他条件过滤熊猫数据框并仅保留行

有条件地连接数据框的行，并根据条件处理其他列

根据其他行的条件添加数据框行

根据其他行的条件填充数据框的行

如何根据列组的多（其他列）条件选择数据框行？

根据其他列条件提取重复的行

根据其他列中的值将函数应用于列中数据框行的子集

如何按其他列的条件按行值提取数据框？

根据条件从其他数据框中添加列

根据其他数据框过滤/子集R日期框

根据唯一值和其他列数据对数据框进行子集设置

根据数据框中某列的条件，删除同一行其他列中的数据

根据其他列中的几种条件选择数据行

Python：在Pandas中，根据条件从数据框中的几列中提取数据，并添加到与某列匹配的其他数据框中

如何根据 R 中其他列的条件过滤/子集数据表？

在数据框中添加新列并根据条件将行值更新为其他列名

按条件子集数据框中的索引提取列

根据其他行的值有条件地标记数据框中的行

在数据框R中动态创建列，并根据其他列条件进行填充

如何根据python中其他列的多个条件更新数据框中的现有列？

如何根据其他列的条件对熊猫的“数据框”列进行操作

根据 R 中其他两列的几个条件向数据框添加新列

根据其他列中的值条件在数据框中跨列应用if语句

如何根据其他列的条件在数据框中创建新列？

根据熊猫数据框中其他列的条件和值创建新列

根据其他两个数据框列中的值条件创建新列

根据数据框中的其他列，在具有多种条件的 Pandas 中添加列

根据 Python 中其他列的条件绘制数据框的列

TOP 榜单

文章

根据其他列的条件提取数据框的行子集

根据其他列的条件提取数据框的行子集

蓝屏死机没有修复解决方案

计算数据帧中每行的NA

UITableView的项目向下滚动后更改颜色，然后快速备份

Node.js中未捕获的异常错误，发生调用

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

Linux的官方Adobe Flash存储库是否已过时？

验证REST API参数

ggplot：对齐多个分面图-所有大小不同的分面

Mac OS X更新后的GRUB 2问题

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

带有错误“ where”条件的查询如何返回结果？

用日期数据透视表和日期顺序查询

VB.net将2条特定行导出到DataGridView

如何从视图一次更新多行（ASP.NET - Core）

Java Eclipse中的错误13，如何解决？

尝试反复更改屏幕上按钮的位置 - kotlin android studio

离子动态工具栏背景色

应用发明者仅从列表中选择一个随机项一次

当我尝试下载 StanfordNLP en 模型时，出现错误

python中的boto3文件上传

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID