使用 grep 从 .csv 文件中选择行

舒布阿什

我有一个 .csv 文件，其中包含如下数据：

English short name (upper/lower case);Alpha-2 code;Alpha-3 code;Numeric code;ISO 3166-2 codes
"Afghanistan";AF;AFG;004;ISO 3166-2:AF
"Åland Islands";AX;ALA;248;ISO 3166-2:AX
"Albania";AL;ALB;008;ISO 3166-2:AL

现在，我需要选择三个字符代码（Alpha-3 代码，第 3 列）中的前两个字符与两个字符代码（Alpha-2 代码，第 2 列）中的两个字符不相同的所有行.

我不知道如何将这两个词与 grep 和 regex 进行比较。

艾拉里昂

正如我在评论中提到的，我绝不是awk专家，所以我 100% 确信其他人可以提出更好的答案。但是现在我认为这可以满足您的需求。我将上面的示例文本放入example.csv：

awk -F';' '{if (NR > 1 && $2 != substr($3,0,2)) print $0}' example.csv

输出：

"Åland Islands";AX;ALA;248;ISO 3166-2:AX

说明：

awk：来自文档，“一个程序，您可以使用它来选择文件中的特定记录并对其执行操作”（请参阅GNU Awk 用户指南）
-F';': 告诉awk使用 a;作为字段分隔符。重要说明，这可能不会很好地处理引用的字段分隔符（例如“AF;”;）
{if (NR > 1 && $2 != substr($3,0,2)) print $0}：这是awk运行的“程序”
- if (... && ...)：一个需要满足两个条件的 if 语句（例如 an和condition）
- NR > 1：仅查看大于 1 的行（例如跳过标题行）
- $2 != substr($3,0,2): 检查第二个标记是否不等于第三个标记的前两个字符
- print $0: 如果条件为真，则打印整行 ( $0)

附加说明

如果您想操作输出——例如，您只需要国家/地区名称（第一个字段），或者想添加一些额外的文本——您可以更改print语句：

awk -F';' '{if (NR > 1 && $2 != substr($3,0,2)) print "Country: " $1}' example.csv

输出：

Country: "Åland Islands"

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-08-25

我来说两句

0 条评论

登录后参与评论

如何使用熊猫在CSV文件中选择某些列

如何使用grep和/或awk在文件中选择多个路径名并删除这些文件？

Grep过滤巨大的CSV文件

在python的csv文件中选择要删除的行

在 .csv 文件中选择列名

使用 grep 将 HTML 解析为 CSV

重击：grep从文件中选择文本

如何使用2个条件限制从csv文件中选择的数据？

导入多个 .csv 文件并使用 r 从多个数据框中选择相同的变量

使用 grep 在 S3 存儲桶上的每個 csv 文件中搜索文本

Python 3-x使用类似SQL的条件从CSV表中选择列和行

并行grep-使用文件行作为grep的输入

grep 无法从 CSV 文件中删除模式

如何使用Xidel从文件中选择要刮擦的行？

Bash使用awk从文件中选择有效行

使用Python从XML文件中选择一些行

使用GREP搜索文件的特定行

使用 grep 选择多个模式

使用grep和sed选择

无法从CSV文件中选择列

从.CSV文件中选择特定范围的列

从CSV中选择特定的行并发送

使用 grep 覆盖日志文件

使用grep -v过滤行

使用 grep 获取特定行

是否可以使用grep、sed或兩者替換csv文件中單元格的值

Grep文件名并在选择菜单中使用

如何在cat和grep文件中选择今天的日期？

如何使用python选择特定的CSV行

TOP 榜单

文章

使用 grep 从 .csv 文件中选择行

使用 grep 从 .csv 文件中选择行

蓝屏死机没有修复解决方案

计算数据帧中每行的NA

UITableView的项目向下滚动后更改颜色，然后快速备份

Node.js中未捕获的异常错误，发生调用

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

Linux的官方Adobe Flash存储库是否已过时？

验证REST API参数

ggplot：对齐多个分面图-所有大小不同的分面

Mac OS X更新后的GRUB 2问题

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

带有错误“ where”条件的查询如何返回结果？

用日期数据透视表和日期顺序查询

VB.net将2条特定行导出到DataGridView

如何从视图一次更新多行（ASP.NET - Core）

Java Eclipse中的错误13，如何解决？

尝试反复更改屏幕上按钮的位置 - kotlin android studio

离子动态工具栏背景色

应用发明者仅从列表中选择一个随机项一次

当我尝试下载 StanfordNLP en 模型时，出现错误

python中的boto3文件上传

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID