我想使用Bash手动将Fastq文件编辑为多个相似的行。
在Fastq文件中,序列读取从第2行开始,然后每四行找到一次(即第2、6、10、14等行)。
我想创建一个与Fastq文件相同的编辑后的文本文件,不同之处在于将整理读取的前6个字符修剪掉了。
未经编辑的Fastq:
@M03017:21:000000000
GAGAGATCTCTCTCTCTCTCT
+
111>>B1FDFFF
编辑的Fastq:
@M03017:21:000000000
TCTCTCTCTCTCTCT
+
111>>B1FDFFF
GNU sed可以做到这一点:
sed -i~ '2~4s/^.\{6\}//' file
地址的2~4
意思是“从第2行开始,每4行重复一次”。
s
表示替换,^
匹配行首,.
匹配任何字符,\{6\}
指定长度(“量词”)。替换字符串为空(//
)。
-i~
将文件替换到位,并~
在文件名后附加备份。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句