如何比较一个CSV中的一行与另一个CSV文件中的所有行?

X先生

我有两个CSV文件:

  1. Identity(no,name,Age) 有十行
  2. Location(Address,no,City) 有100行

我需要提取行并检查no在列IdentityLocationCSV文件。

IdentityCSV文件中获取单行,然后检查CSV文件中是否Identity.no包含Location.no100行Location

如果匹配,则组合name, Age, Address, CityIdentity, Location

注:我需要从获得第1行Identity与100行进行比较LocationCSV文件,然后让第二排与100行进行比较。它将在IdentityCSV文件中最多连续10行

然后将整体结果转换为Json,然后将结果移至SQL Server。

Apache Nifi中可能吗?

任何帮助表示赞赏。

詹姆士

您可以使用DistributedMapCache功能在NiFi中执行此操作,该功能实现了用于查找的键/值存储。该设置需要一个分布式地图缓存,外加两个流程-一个流程用地址记录填充缓存,另一个流程按no字段查找地址

  1. DistributedMapCache由两个控制器服务(一个DistributedMapCacheServer和一个DistributeMapCacheClientService)定义如果您的数据集很小,则可以仅使用“ localhost”作为服务器。

  2. 填充缓存需要读取地址文件,拆分记录,提取no键并将键/值对放入缓存。大概的流程可能包括GetFile-> SplitText-> ExtractText-> UpdateAttribute- > PutDistributedMapCache

  3. 查找您的身份记录实际上与上面的流程非常相似,因为它需要读取身份文件,拆分记录,提取no密钥,然后获取地址记录。处理器流可能包括GetFile-> SplitText-> ExtractText-> UpdateAttribute- > FetchDistributedMapCache

您可以使用AttributesToJSON或ExecuteScript将全部或部分从CSV转换为JSON。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

检查另一个csv文件中每一行的csv文件值

如何根据另一个文件中的列表值从csv文件中删除行?

SELECT 一个表的一行,以及另一个表中的所有行

检查一个文件中是否存在一行,检查另一个文件中的所有其他行

从 bash 中删除与另一个文件中的行匹配的 CSV 文件中的行?

如何从csv中删除与另一个csv中的行匹配的行

如何读取 CSV 并将每一行调整 + 写入另一个 CSV?

如何删除一行中的所有内容,直到一个模式,以及另一个模式之后的所有内容?

删除 CSV 文件中的所有行,而在另一个 CSV 文件中没有对应/匹配的时间戳

如何根据linux中的条件(使用awk或其他方法)将一个csv文件的行与另一个csv文件的行替换?

如何在一个文件中搜索另一个文件中的单词并显示一行中的第一个匹配单词

如何将一个文件中的一行一行添加到另一个文件中

将一个日期列与另一行中的另一个日期列进行比较

有条件地在Scala / Spark的CSV文件中映射行,以生成另一个CSV文件

创建一个新的ArrayList,其中包含另一个ArrayList的所有元素,除了一行代码中的一行

如何使用sed / awk将某一行之后的文件中的所有文本替换为另一个文本文件的内容?

从另一个文件中删除文件中与文本不匹配的所有行

将文件中的行每隔一行引入另一个文件

如何逐行读取csv文件,修改每一行,将结果写入另一个文件

在JMeter中,一个用户如何连续读取CSV文件的每一行?

将csv中的某些列附加到另一个csv文件中不会分散每一行

将txt文件中的每一行与每一行中的另一个文本文件进行比较

如何比较两个不同的csv文件中的列并替换另一个文件中的列

如何通过查询另一个表中的数据选择一个表中的所有行

如果在另一个 CSV 文件中找到行值,则从 CSV 文件中过滤行

如何从csv文件提取行到另一个csv文件?

使用另一个python文件在python文件中编辑/添加一行

如何使用grep / awk / unix将一个文件中的所有行匹配到另一个文件中,即使它们是重复的

如何从矩阵中删除与另一个向量中的值匹配的所有行?