R:如何检查列表中的每个元素是否部分匹配数据框中的一列?

我有一个 test_list

test_list <- list("hg38:Chr12:8823762", "hg38:Chr10:50814012", "hg19:Chr12:8990070", 
        "hg38:chr1:16949", "hg38:chr9:342484")

我想检查我的列表中的每个元素部分我的专栏匹配Extra_informationdf

df <- structure(list(Extra_information = c("hg38:Chr10:50814012, hg19:Chr10:52573772, CpG:Mutation may have occured by deamination of methylated CpG dinucleotide", 
"hg38:Chr12:8822661, hg19:Chr12:8975257, COM:Patient is homozygous for c.706C>G p.Leu236Val in SLC26A4., dbSNP:http://www.ncbi.nlm.nih.gov/SNP/snp_ref.cgi?type=rs&rs=rs1409944554", 
"hg38:Chr12:8823729, hg19:Chr12:8976325, COM:Variant of unknown significance. Clinical features descr. in supplementary table 2. functional study., dbSNP:http://www.ncbi.nlm.nih.gov/SNP/snp_ref.cgi?type=rs&rs=rs766201825", 
"hg38:Chr12:8823762, hg19:Chr12:8976358, COM:VUS Table 2. RIT1 variant also present.", 
"hg38:Chr12:8835642, hg19:Chr12:8988238, COM:VUS Table 2. SOS1 and CBL variants also present., dbSNP:http://www.ncbi.nlm.nih.gov/SNP/snp_ref.cgi?type=rs&rs=rs11047499", 
"hg38:Chr12:8837474, hg19:Chr12:8990070, dbSNP:http://www.ncbi.nlm.nih.gov/SNP/snp_ref.cgi?type=rs&rs=rs863224952"
)), row.names = c(NA, 6L), class = "data.frame")

获得我的列表中,其中值的数据帧1TRUE0FALSE

test_df <- structure(list(Entries = c("hg38:Chr12:8823762", "hg38:Chr10:50814012", "hg19:Chr12:8990070", 
        "hg38:chr1:16949", "hg38:chr9:342484"), Values = c(1,1,1,0,0)), row.names = c(NA, 5L), class = "data.frame"))

输出

如何获得所需的输出?

提前致谢。

阿克伦

我们可以agrepl用来检查'test_list'元素和'Extra_information'之间的部分匹配(base R来自

Values <- +(sapply(test_list, function(x) any(agrepl(x, df$Extra_information))))
data.frame(Entries = unlist(test_list), Values)
#              Entries Values
#1  hg38:Chr12:8823762      1
#2 hg38:Chr10:50814012      1
#3  hg19:Chr12:8990070      1
#4     hg38:chr1:16949      0
#5    hg38:chr9:342484      0

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何获得匹配数据框中的一列的值与另一列

将列表中的每个元素与数据框 python 中的一列列表进行比较

从熊猫数据框中基于另一列的列的每个列表中删除元素

如何检查r中数据框中的一列值是否对应于数据框中每一行的另一列?

如何在R的数据框中计算列表列的每一列中的元素

如何检查数据框中的一列是否与另一数据框中的一列完全相等

r 匹配两个数据框中的数据,然后在另一列中检查匹配行中的文本

R:检查矩阵的每一列中向量的每个元素是否存在的最快方法

申请检查一列中的元素是否包含在另一列的列表中

如何检查和删除R中另一列中的字符串是否匹配

匹配数据框中的元素

检查多列是否在R数据框中匹配值

如何自动查找列表的值是否存在于 R 的另一列数据框中

根据包含R中数据框的元素列表的名称创建一列

基于R中的多列匹配数据框

检查一列是否包含来自pandas数据框中另一列的单词

匹配数据框中列的文本

匹配数据框中的两列

仅重命名数据框列表中每个数据框的最后一列

将匹配数据从熊猫数据框中的另一个列提取到列表中

检查来自不同列表的元素是否在 df 列中并附加到另一列

熊猫数据框检查列是否包含另一列中存在的字符串

Python,数据框:在列表的一列中复制元素,并将其归因于另一列中的行

将 array.tolist() 添加到 Pandas 数据框中的一列后,获取每个单元格中存储一个元素的列表

将一列附加到列表中的每个数据框

在R中的多个数据框中的一列中创建唯一值列表

R - 在我的数据框中创建一列,其中包含基于彼此重叠的每个列表(在列表对象列表中)的名称

在对数据框的一列进行装箱后,如何制作一个新的数据框以计算每个箱中的元素数量?

R如何匹配数据框以检索元素