如何在spark中同时拆分数据帧中的两个映射列

KAY_YAK

我有一个这种形式的数据框

+--------------------------------------+-----------------------------+
|hashMap                               |name                         |
+--------------------------------------+-----------------------------+
|[{"A":"0","B":"0","C":"0"}, {"X":"0"}]|[M, D]                       |
+--------------------------------------+-----------------------------+

我想把它分成这个

+--------------------------------------+-----------------------------+
|hashMap                               |name                         |
+--------------------------------------+-----------------------------+
|"A":"0","B":"0","C":"0"               | M                           |
|"X":"0"                               | D                           |
+--------------------------------------+-----------------------------+

我知道爆炸拆分,但我不知道它是否适用于两列。此外,有时两列中可能只有一个值

例如

+-----------+-----------+
|hashMap    |name       |
+-----------+-----------+
|[{"A":"0"} |[M]        |
+-----------+-----------+

如何使爆炸拆分通用以在 Scala 中处理此问题?

麦克

您可以使用以下命令压缩数组并分解它们inline

val df2 = df.selectExpr("inline(arrays_zip(hashMap, name))")

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何根据两个不同列之一中包含的元素拆分数据帧?

如何在python中组合回两个拆分的数据帧?

如何在Spark中合并两个不同的数据帧?

如何在Apache Spark中的两个单独的数据帧上执行算术运算?

如何在R中拆分数据帧

如何在两个单个数组 X=Date 和 y=Value 中拆分 Pandas 数据帧(Date,Value)?

在一个数据帧中拆分所有列,并在R中创建两个数据帧

如何在熊猫中按行拆分数据帧或重新排序数据帧

如何在数据帧单元中拆分数据并在拆分时执行Pandas groupby?

如何在JSX中同时映射对象数据或两个数组

如何比较pyspark中两个不同数据帧中的两列

拆分数据帧中与特定列配对的多个列

如何在SQL中拆分数据

如何在AngularJS中拆分数据?

在R中,如何按多个列中的因数拆分/细分数据帧?

Matlab:如何在保留标签信息的同时将数据矩阵拆分为列向量的两个随机子集?

如何从熊猫的列中拆分数据?

Pandas - 根据列中的排序顺序拆分数据帧

如何在R中的另一个数据帧中同时满足两个条件的情况下为一个数据帧设置子集?

如何在 R 中的这两个数据帧中散列?

Pyspark - 从两个不同的数据帧中减去列

如何按R中的特定行拆分数据帧

如何在pyspark中使用pandas_udf拆分数据帧中的字符串

基于python中另一个数据帧的列值拆分数据帧

如何在R中将单个列中的内容拆分为两个单独的列?

如何使用mapply将函数应用于两个不同数据帧中的两个不同列

如何在R中绑定两个数据帧?

每当列中的字符串值更改时,如何拆分数据帧?

如何使用某些列的某些子级别拆分数据帧并在 tidyverse 中应用模型