如何从目录中的文件中提取特定信息?

昌达7

我有大约 50 个文件,它们以以下格式命名:ERR*.log(即 ERR23432.log、ERR12356.log 等等...)。我想从每个文件中提取特定信息(值)。在每个文件中,行末尾都有值:final pair1 : Total reads after merging results from multiple databasefinal pair2 : Total reads after merging results from multiple databases您可以在附件的第 62 行和第 63 行中看到这些行现在,我想要一个脚本来提取这些值并添加它们以获得每个文件的单个值。然后,它会给出一个带有提取信息的输出文件,其中第一列是没有扩展名的文件名(即附加示例中的 ERR45666),第二列是附加值。任何人都可以帮我吗?

钢刀

使用 GNU awk:

gawk '
  BEGIN {print "SampleID","Read_counts"}
  BEGINFILE {sum = 0} 
  /final pair[12] : Total reads after merging results from multiple database/ {sum += $NF}
  ENDFILE {print substr(FILENAME,1,length(FILENAME)-4), sum}
' *.log

使用标准 (POSIX) awk,您可以轻松伪造BEGINFILEusing,FNR==1ENDFILE模式更难;在这种情况下,我建议使用一个数组作为总和,以当前文件名为键,并在END

awk '
  BEGIN {print "SampleID","Read_counts"}
  FNR==1 {k = substr(FILENAME,1,length(FILENAME)-4)}
  /final pair[12] : Total reads after merging results from multiple database/ {sum[k] += $NF}
  END {for(k in sum) print k, sum[k]}
' *.log

请注意,使用这种方法,不能保证输出顺序与文件名的 glob 扩展顺序相同*.log

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何从python中的文件中提取特定信息

从R中的NetCDF文件中提取特定于站点的信息

从 csv 文件中的字符串中提取特定信息

如何从多个文件中提取特定信息并在Linux中创建表?

如何从POST请求有效负载中提取特定信息并保存到txt文件中?

从Python目录中的多个CSV文件中提取特定列

如何从目录中复制特定文件,而目录名称是使用 Bash 脚本从 excel 文件中提取的

如何从 Lambda 中的警报事件中提取特定信息

如何在Powershell中从RSS提要中提取特定信息?

无法从日志文件中提取特定信息

如何从flask中的txt(RIS)文件中提取信息

在目录中提取特定文件-Windows

如何从目录中的文件名中提取字符?

如何从pandas列中提取特定信息?

如何从Excel文件中提取组信息

想要从耳朵文件中提取特定的jar文件并将其存储在特定目录中

如何从完整文件路径中提取目录

如何从python中的.tar存档中提取特定文件?

如何从tar文件的根目录中提取具有特定扩展名的文件?

如何从XML文件中提取具有API命名空间的特定内容?以下详细信息是

使用PHP从文本文件中提取特定信息

从大型特定标头格式的文件中提取信息

从 AzureAD 中提取特定信息

从数据中提取特定信息

从数组中提取特定信息

从文本中提取特定信息

从日志中提取特定信息

如何从 gz 文件中提取特定文本?

如何从tar存档中提取特定文件?