有条件地提取列

安娜1364

我有大量文件（3300），这是我的基因组扫描输出的结果，anacovis2_1_summary_betai_reg.out ... anacovis2_3300_summary_betai_reg.out每个文件看起来都像这样（仅几行）：

 1    4996     0.03907811     0.19369659   -10.43580084     0.00150707     0.00836902     0.06697258
  1    4997     0.06213154     0.17373333   -10.98540609     0.00213014     0.00556877     0.15361369
  1    4998    -0.00284978     0.19418451    -8.81547738     0.00016505     0.00741737     0.00777931
  1    4999    -0.02047544     0.19574268    -9.12692867    -0.00059062     0.00632552     0.03357265
  1    5000    -0.01769435     0.18560835   -13.15854481    -0.00038595     0.00540918     0.02543350
  2       1     0.04259550     0.20256840   -10.98339784     0.00120126     0.00529516     0.08590396
  2       2    -0.10782050     0.17555969    -9.13783036    -0.00355861     0.00689091     0.21784244
  2       3     0.02548854     0.18571440   -15.42307129     0.00006131     0.00291038     0.00736142
  2       4     0.03084782     0.17813247   -11.99911720     0.00109688     0.00630034     0.06459986

第一列是环境变量，范围是1到26。我想遍历每个文件，仅提取每个环境变量的第四列，然后将它们保存在带有环境变量编号后缀的文件中。

我知道如何分别为每个环境变量（例如变量1）执行此操作

awk '($1==1){print $4>FILENAME"_env1"}'anacovis2_{1..3300}_summary_betai_reg.out

或对于变量2

awk '($1==2){print $4>FILENAME"_env2"}'anacovis2_{1..3300}_summary_betai_reg.out

但是如果我想这样做需要花费时间，例如，我想知道是否可以更快地循环执行。我尝试过这样的事情

for i in {1..26};
do awk '($1==i){print $4>FILENAME"_i"}'anacovis2_{1..3300}_summary_betai_reg.out
done

但是没有用！有人可以帮我解决这个问题吗？谢谢

αғsнιη

就在这里。以这种方式awk仅对自身执行此操作。

awk '{print $4>FILENAME"_env"$1}' anacovis2_{1..3300}_summary_betai_reg.out

要将所有文件中的每个相同的env保存到同一个文件（例如env1，env2等）中，只需将其放在FILENAME其中并使用即可运行命令{print $4>"env"$1}。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-04-2

我来说两句

0 条评论

登录后参与评论

有条件地添加列

有条件地突变列

有条件地提取连续的递减数

使用xmlstarlet有条件地提取XML属性

有条件地提取CSV文件的行？

使用rollapply从向量中有条件地提取

有条件地发送JSON密钥以进行提取

从存档文件中有条件地提取文件

R：根据列内容有条件地提取列名称

有条件地按条件改变列

根据列类有条件地改变列

根据模式有条件地突变新列

ActiveAdmin有条件地显示列

有条件地生成新列-Pandas

有条件地选择列值sql

有条件地合并多列

如何有条件地合并数据框列

在熊猫df中有条件地填充列

有条件地按不同列分组

DAX有条件地从不同的列求和？

熊猫：如何有条件地分配多个列？

使用`dplyr`有条件地改变列值

有条件地填充新列

Pandas DataFrame：有条件地更新两列

如何有条件地删除r中的列？

pandas：有条件地返回列的值

有条件地在R中选择多个列

有条件地连接两列

有条件地选择多个列-Python

TOP 榜单

文章

有条件地提取列

有条件地提取列

Qt Creator Windows 10 - “使用 jom 而不是 nmake”不起作用

使用next.js时出现服务器错误，错误：找不到react-redux上下文值；请确保组件包装在<Provider>中

Swift 2.1-对单个单元格使用UITableView

SQL Server中的非确定性数据类型

如何避免每次重新编译所有文件？

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

HttpClient中的角度变化检测

在 Avalonia 中是否有带有柱子的 TreeView 或类似的东西？

在Wagtail管理员中，如何禁用图像和文档的摘要项？

通过iwd从Linux系统上的命令行连接到wifi（适用于Linux的无线守护程序）

构建类似于Jarvis的本地语言应用程序

Camunda-根据分配的组过滤任务列表

如何了解DFT结果

Embers js中的更改侦听器上的组合框

ggplot：对齐多个分面图-所有大小不同的分面

使用分隔符将成对相邻的数组元素相互连接

PHP Curl PUT 在 curl_exec 处停止

您如何通过 Nativescript 中的 Fetch 发出发布请求？

错误：找不到存根。请确保已调用spring-cloud-contract：convert

应用发明者仅从列表中选择一个随机项一次