Linux结合了两个不同的文本文件

清除彩

我想要使用以下功能awk，sed或使用其他工具。

比较两个具有ID的文件（File1，File2）。
如果具有相同的ID，则将相同的数据从File2带到File1。

例如如下

第一个文件名：File1.txt
内部（以制表符分隔的表格式）

ID      Match     Length
100      OK        1000
200      OK        1000
300      OK        2000
400      OK        2000
500      OK        3000

第二文件名：File2.fasta
该信息包含如下信息

>100
ACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTG
>200
CTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGA
>300
TGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGAC
>400
GACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACT
>500
ACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTG

所以我想从File2.fasta再扩展一列到File1.txt文件，所以这是最终结果

ID      Match     Length     Sequence
100      OK        1000     ACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTG
200      OK        1000     CTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGA
300      OK        2000     TGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGAC
400      OK        2000     GACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACT
500      OK        3000     ACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTG

有没有人对如何合并这两个文件有什么好主意？

泰勒·佩里亚（Tyler Peryea）

我相信，您正在寻找加入的机会。

首先，您需要对文件进行排序，并且使用通用格式（相同的定界符）。

cat File2.fasta |sed 's/$/\t/g'|tr -d '\n' |sed 's/>/\n/g'|sort > File2.fasta.sorted
cat File1.txt|sort > File1.txt.sorted

然后，您只需要像这样加入：

join -a1 -t'$TAB' File1.txt.sorted File2.fasta.sorted

注意这里$ TAB是指制表符。

这将产生如下内容：

100 OK  1000    ACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTG    
200 OK  1000    CTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGA    
300 OK  2000    TGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGAC    
400 OK  2000    GACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACT    
500 OK  3000    ACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTGACTG    
ID  Match   Length

您想要的是哪一个（列名/位置除外）。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-03-23

我来说两句

0 条评论

登录后参与评论

上一篇：JavaScript无法在页面上加载

Linux结合了两个不同的文本文件

Linux结合了两个不同的文本文件

蓝屏死机没有修复解决方案

计算数据帧中每行的NA

UITableView的项目向下滚动后更改颜色，然后快速备份

Node.js中未捕获的异常错误，发生调用

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

Linux的官方Adobe Flash存储库是否已过时？

验证REST API参数

ggplot：对齐多个分面图-所有大小不同的分面

Mac OS X更新后的GRUB 2问题

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

带有错误“ where”条件的查询如何返回结果？

用日期数据透视表和日期顺序查询

VB.net将2条特定行导出到DataGridView

如何从视图一次更新多行（ASP.NET - Core）

Java Eclipse中的错误13，如何解决？

尝试反复更改屏幕上按钮的位置 - kotlin android studio

离子动态工具栏背景色

应用发明者仅从列表中选择一个随机项一次

当我尝试下载 StanfordNLP en 模型时，出现错误

python中的boto3文件上传

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID