映射到列的键和值到行的键

253

DiR95

我在输入中有一个数据框，其中包含id列和Map列。

地图：

key1 -> value1, key2 -> value2 ... key100 -> value100,
key1 -> value3, key2 -> value4 ... key100 -> value200

我想要输出以下结果：

id   key1     key2    ...  key100
1    value1   value2       value100
2    value3   value4       value200

感谢您的退货，祝您有美好的一天。

复活

这是一个基于Spark内置函数的解决方案：

import org.apache.spark.sql.functions.{monotonically_increasing_id, explode, first}

val df = Seq(
    (Map("key1" -> "value1", "key2" -> "value2", "key3" -> "value3", "key4" -> "value4")),
    (Map("key1" -> "value1", "key2" -> "value2")),
    (Map("key1" -> "value1", "key3" -> "value3")))
.toDF("map_data")

df.withColumn("id", monotonically_increasing_id)
  .select($"id", explode($"map_data"))
  .groupBy("id")
  .pivot("key")
  .agg(first("value"))
  .show(false)

// +---+------+------+------+------+
// |id |key1  |key2  |key3  |key4  |
// +---+------+------+------+------+
// |0  |value1|value2|value3|value4|
// |1  |value1|value2|null  |null  |
// |2  |value1|null  |value3|null  |
// +---+------+------+------+------+

说明

withColumn("id", monotonically_increasing_id) ：为每行添加唯一的ID。
explode($"map_data")：map_data将其爆炸将创建另外两个列，key和value。
groupBy...pivot ：按ID分组并按键旋转

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-22

我来说两句

0 条评论

登录后参与评论

映射到列的键和值到行的键

映射到列的键和值到行的键

映射到列的键和值到行的键

说明

Linux的官方Adobe Flash存储库是否已过时？

如何使用HttpClient的在使用SSL证书，无论多么“糟糕”是

错误：“ javac”未被识别为内部或外部命令，

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

Modbus Python施耐德PM5300

为什么Object.hashCode（）不遵循Java代码约定

如何检查字符串输入的格式

检查嵌套列表中的长度是否相同

错误TS2365：运算符'！=='无法应用于类型'“（”'和'“）”'

如何自动选择正确的键盘布局？-仅具有一个键盘布局

如何正确比较 scala.xml 节点？

在令牌内联程序集错误之前预期为 ')'

如何在JavaScript中获取数组的第n个元素？

如何将sklearn.naive_bayes与（多个）分类功能一起使用？

ValueError：尝试同时迭代两个列表时，解包的值太多（预期为 2）

如何监视应用程序而不是单个进程的CPU使用率？

解决类Koin的实例时出错

ES5的代理替代

有什么解决方案可以将android设备用作Cast Receiver？

VBA 自动化错误：-2147221080 (800401a8)

套接字无法检测到断开连接