如何使用 grep 匹配精確的單詞

Christ14n97

我在 zsh 中有一個列表/數組，它是 house=$(cat corrected_inhouse_list.txt)

包含：

N-METHYL-L-GLUTAMIC ACID
L-GLUTAMIC ACID
CREATINE
L-PROLINE
CREATINE PHOSPHATE
L-VALINE
L-TYROSINE
L-KYNURENINE
L-PHENYLALANINE
PHENYLETHANOLAMINE
D-PANTOTHENIC ACID
L-TRYPTOPHAN
MYRISTIC ACID

文件“metexplore_IDs_DB.tsv”：

8:M_Lkynr   exact multimatching 1   L-KYNURENINE    CHEBI:16946 NA  NA
21:M_glu_L  exact multimatching 1   L-GLUTAMIC ACID CHEBI:16015 NA  NA
40:M_trp_L  exact multimatching 1   L-TRYPTOPHAN    CHEBI:16828 NA  NA
42:M_pro_L  exact multimatching 1   L-PROLINE   CHEBI:17203 NA  NA
50:M_phe_L  exact multimatching 1   L-PHENYLALANINE CHEBI:17295 NA  NA
56:M_creat  exact multimatching 1   CREATINE    CHEBI:16919 NA  NA
57:M_34dhphe    exact multimatching 1   3,4-DIHYDROXY-L-PHENYLALANINE (L-DOPA)  CHEBI:15765 NA  NA
61:M_tyr_L  exact multimatching 1   L-TYROSINE  CHEBI:17895 NA  NA
63:M_val_L  exact multimatching 1   L-VALINE    CHEBI:16414 NA  NA
94:M_Lkynr  exact multimatching 1   L-KYNURENINE    CHEBI:16946 NA  NA
95:M_5oxpro exact multimatching 1   5-OXO-L-PROLINE CHEBI:18183 NA  NA
107:M_4hpro_LT  exact multimatching 1   4-HYDROXY-L-PROLINE CHEBI:18095 NANA
171:M_pcreat    exact multimatching 1   PHOSPHOCREATINE CHEBI:17287 NA  NA
191:M_pnto_R    exact multimatching 1   D-PANTOTHENIC ACID  CHEBI:7916  NANA
211:M_pcreat    exact multimatching 1   CREATINE PHOSPHATE  CHEBI:17287 NANA
237:M_35diotyr  exact multimatching 1   3,5-DIIODO-L-TYROSINE   CHEBI:15768 NANA
315:M_ttdca exact multimatching 1   MYRISTIC ACID   CHEBI:28875

我想使用 grep 來匹配文件上的這些詞。問題是可以在圖片中看到的內容，grep 還捕獲包含但不以我的興趣詞開頭的詞。

我試過了：

for i in ${house[*]}; do grep -n -E "^\s*\{$i}\>" metexplore_IDs_DB.tsv; done
for i in ${house[*]}; do grep -n -E -w "\<$i" metexplore_IDs_DB.tsv; done 
for i in ${house[*]}; do grep -n -E "(^|\t)$i" metexplore_IDs_DB.tsv; done

我可以做什麼來實現我的目標？所需的輸出將沒有第 57、95、107 和 237 行。

巴馬

看起來你總是匹配字段 4。所以awk會是一個更好的解決方案，因為你可以簡單地對整個字段進行精確匹配：

for i in "${house[@]}"; do
    awk -F'\t' -v i="$i" '$4 == i' metexplore_ID.tsv
done

不要忘記周圍的引號${house[@]}；否則元素 likeL-GLUTAMIC ACID將被視為兩個不同的詞來匹配。

您還可以通過corrected_inhouse_list.txt直接加載到awk數組中來避免創建數組和循環：

awk -F'\t' -v i="$i" '
    NR == FNR {houses[$0]++; next} 
    $4 in houses' corrected_inhouse_list.txt metexplore_ID.tsv

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-12-10

我来说两句

0 条评论

登录后参与评论

如何 Grep 包含多個單詞的字符串但單獨準確地檢查每個單詞？

使用 grep（或 awk）提取兩個連續的單詞

如何使用grep -e匹配部分单词？

如何使用完全匹配的grep行

如何使用grep匹配双引号

使用grep匹配模式\\\“

如何匹配包含符號的單詞？

如何grep一個四個字母長且以某個字母開頭的單詞

如何保存grep匹配行？

如何用grep匹配汉字？

GREP：如何匹配正数或负数？

grep如何匹配目录URL？

如何让grep闪烁匹配的模式？

使用grep完全匹配Word

使用 grep 进行近似匹配

使用grep打印匹配组

grep -w 在具有非拉丁字母的單詞中查找部分匹配

如何使用grep进行匹配但不打印匹配项？

使用 pyspark 進行包含和精確模式匹配

匹配后如何在字节中使用grep -E

如何使用通配符grep匹配单词而不是周围的行？

如何使用grep和regex匹配特定长度的单词？

如何使用grep打印行直到匹配右括号？

如何使用grep命令复制单词匹配？

如何使用GNU grep突出显示匹配项？

如何使用 grep 或其他命令以正确的方式提取匹配？

如何使用grep（）/ gsub（）查找完全匹配

如何使用grep匹配不完整的文件名

如何使用 grep 匹配作为变量（而不是整行）

TOP 榜单

文章

如何使用 grep 匹配精確的單詞

如何使用 grep 匹配精確的單詞

UITableView的项目向下滚动后更改颜色，然后快速备份

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Mac OS X更新后的GRUB 2问题

验证REST API参数

Java Eclipse中的错误13，如何解决？

带有错误“ where”条件的查询如何返回结果？

ggplot：对齐多个分面图-所有大小不同的分面

尝试反复更改屏幕上按钮的位置 - kotlin android studio

如何从视图一次更新多行（ASP.NET - Core）

计算数据帧中每行的NA

蓝屏死机没有修复解决方案

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

离子动态工具栏背景色

VB.net将2条特定行导出到DataGridView

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

在Windows 7中无法删除文件（2）

python中的boto3文件上传

当我尝试下载 StanfordNLP en 模型时，出现错误

Node.js中未捕获的异常错误，发生调用