使用gawk提取列中带有字符串的行

Brian 发表于 Dev

布莱恩

我试图从制表符分隔的文件中提取行，如果该文件在第4列中包含某个单词。例如，如果输入文件test.txt为：

chr     8       1234    abc ; xyz
chr     8       1255    abc
chr     8       987     xyz
chr     8       5467    jxyzm

以下代码仅正确输出第一行和第三行：

gawk -F"\t" ' { if($4 ~ /\<xyz\>/) print $0 } ' test.txt >> test.out

但是，当我尝试在bash脚本中循环运行此文件时，我的输出文件为空白。我使用的代码是：

while read id
do    
    OFILE=${ODIR}/${id}.txt
    gawk -v id="$id" -F"\t" ' { if($4 ~ /\<id\>/) print $0 } ' ${IFILE} >> ${OFILE}
done < ${GFILE}

文件$ {GFILE}每行只有一个字，例如：

xyz
fg45
tre2y

我究竟做错了什么？

谢谢！

编辑为：

在输入文件中添加第四行
在命令中添加了-v id =“ $ id” ...脚本仍然不起作用！

阿努巴瓦

您可以很好地用来awk从一个文件中读取搜索模式，并在另一个文件中找到匹配项，如下所示：

awk -F '\t' '
NR == FNR {
   words[$1]
   next
}
{
   for (w in words)
      if (index($4, w)) {
         print > w ".txt"
         break
      }
}' "$GFILE" "$IFILE"

然后检查输出：

cat xyz.txt

chr     8       1234    abc ; xyz
chr     8       987     xyz

如果您真的想修复您的Shell脚本，那么这里是：

while read id; do
    awk -F '\t' -v id="$id" '$4 ~ id' "$IFILE" > "$id.txt"
done < "$GFILE"

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-25

我来说两句

0 条评论

登录后参与评论

使用gawk提取列中带有字符串的行

使用gawk提取列中带有字符串的行

Qt Creator Windows 10 - “使用 jom 而不是 nmake”不起作用

使用next.js时出现服务器错误，错误：找不到react-redux上下文值；请确保组件包装在<Provider>中

Swift 2.1-对单个单元格使用UITableView

SQL Server中的非确定性数据类型

如何避免每次重新编译所有文件？

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

HttpClient中的角度变化检测

在 Avalonia 中是否有带有柱子的 TreeView 或类似的东西？

在Wagtail管理员中，如何禁用图像和文档的摘要项？

通过iwd从Linux系统上的命令行连接到wifi（适用于Linux的无线守护程序）

构建类似于Jarvis的本地语言应用程序

Camunda-根据分配的组过滤任务列表

如何了解DFT结果

Embers js中的更改侦听器上的组合框

ggplot：对齐多个分面图-所有大小不同的分面

使用分隔符将成对相邻的数组元素相互连接

PHP Curl PUT 在 curl_exec 处停止

您如何通过 Nativescript 中的 Fetch 发出发布请求？

错误：找不到存根。请确保已调用spring-cloud-contract：convert

应用发明者仅从列表中选择一个随机项一次