从大型文本文件中读取行组

Ben 发表于 Dev

ben

我想从大型（〜870,000,000行）文本文件中提取某些行组。例如，在50行文件中，我可能需要3-6、18-27和39-45行。

通过浏览Stack Overflow，我发现bash命令是：

tail -n+NUMstart file |head -nNUMend

这是从NUMstart到NUMend的获取单行或多行的最快方法。但是，当读取多组线时，这似乎效率很低。通常，该技术没什么大不了的，但是对于如此大的文件，它将产生巨大的变化。

有没有比在每行中使用上述命令更好的方法了？我假设答案很可能是bash命令，但实际上对任何能最好地完成工作的语言/工具都是开放的。

赛勒斯

要显示sed的第3-6、18-27和39-45行：

sed -n "3,6p;18,27p;39,45p" file

还可以从文件中馈送sed。

文件内容foobar：

3,6p 
18,27p 
39,45p

用法：

sed -n -f foobar file

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-05-23

我来说两句

0 条评论

登录后参与评论

在Python中从大型文本文件读取数据块

无法在C中读取大型文本文件

如何在 Java 的大型文本文件报告中每页读取/列出 30 行？

从文本文件中读取一组值

读取大型文本文件（超过400万行）并解析.NET中的每一行

在go中读取文本文件中的随机行

从Java中的文本文件读取特定行

在php中读取文本文件的行和列

从C中的文本文件读取前N行

从Java中的文本文件读取特定行

从VB.NET中的文本文件读取行

python：从压缩的文本文件中读取行

如何从PHP中的文本文件读取特定行

Bash脚本读取文本文件中的随机行

如何只读取文本文件中的特定行？

如何使用RUBY读取文本文件中的行

读取文本文件并忽略C中的注释行

从QML Qt / Quick中的文本文件读取行

从文本文件中的特定行读取数字

在vbscript中读取文本文件的特定行

如何从文本文件中读取 5 行

从文本文件中读取行并自动分配变量

使用Java Spark逐行读取大型文本文件

从特定行读取文本文件

读取R中的文本文件

在Golang中读取文本文件？

从文本文件中读取元组

Python 从文本文件中读取

从文本文件中逐行读取

TOP 榜单

文章

从大型文本文件中读取行组

从大型文本文件中读取行组

UITableView的项目向下滚动后更改颜色，然后快速备份

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Mac OS X更新后的GRUB 2问题

验证REST API参数

Java Eclipse中的错误13，如何解决？

带有错误“ where”条件的查询如何返回结果？

ggplot：对齐多个分面图-所有大小不同的分面

尝试反复更改屏幕上按钮的位置 - kotlin android studio

如何从视图一次更新多行（ASP.NET - Core）

计算数据帧中每行的NA

蓝屏死机没有修复解决方案

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

离子动态工具栏背景色

VB.net将2条特定行导出到DataGridView

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

在Windows 7中无法删除文件（2）

python中的boto3文件上传

当我尝试下载 StanfordNLP en 模型时，出现错误

Node.js中未捕获的异常错误，发生调用