如何将df单元中的数组转换为单独的列名？

索米尔·阿塞贾

我无法在DF以下转换：

 | A | B |     C   |     
 | 1 | 2 | t1,t2,t3|     
 | 1 | 3 | t4,t5   |     
 | 2 | 2 | t1,t5   |

到DF以下：

| A | B | t1 | t2 | t3 | t4 | t5 | 
| 1 | 2 | 1  | 1  | 1  | 0  | 0  | 
| 1 | 3 | 0  | 0  | 0  | 1  | 1  | 
| 2 | 2 | 1  | 0  | 0  | 0  | 1  |

在斯卡拉火花中。

列C中的值以逗号分隔，我希望它使它们成为独立的列。一旦做到这一点我想，如果那个特定行标记0和1 t1，t2等的存在与否。

请在这里帮助。会真的很感激。

ido堂

可以使用来完成pivot。然而，第一分割上的数据“”和explode在C列。

df.withColumn("C", explode(split($"C", ",")))
  .groupBy("A", "B")
  .pivot("C")
  .count()
  .na.fill(0)

结果：

+---+---+---+---+---+---+---+
|  A|  B| t1| t2| t3| t4| t5|
+---+---+---+---+---+---+---+
|  2|  2|  1|  0|  0|  0|  1|
|  1|  2|  1|  1|  1|  0|  0|
|  1|  3|  0|  0|  0|  1|  1|
+---+---+---+---+---+---+---+

上述解决方案假定所有的行具有的值的唯一组合中A和B（由于使用的groupBy）。如果不是这种情况，则需要执行其他步骤：

添加一个新列一个唯一的ID可与使用A，并B在groupBy，例如：

df.withColumn("D", monotonically_increasing_id)

可以在之后删除此列pivot。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-21

我来说两句

0 条评论

登录后参与评论

上一篇：如何在Laravel的控制器中获取选定的无线电输入阵列

如何将 JSON 数组转换为单独的值以插入到我的 SQL 表中？

如何将df中的双引号向量转换为numpy数组？

如何将具有相同键的数组中的对象转换为同一数组中自己的单独对象

如何将字符串转换为配置单元中的结构数组并爆炸？

如何将逗号分隔的数组转换为配置单元中的行

在MATLAB中：如何将结构的嵌套字段转换为单元格数组？

如何将Pandas DataFrame的列转换为单独的dict，其中dictnames为列名？

如何将数组中的数组转换为数组对象

如何将 DF 转换为字符串/数组，然后再转换回 DF？

如何将字典转换为 DF

如何将结构的单元格数组转换为单元格数组

如何将 JSON 数组转换为 PHP 中的数组？

如何将数组数组转换为 Julia 中的矩阵？

如何将发出数组的 observable 转换为单独发出数组的每个值的 observable？

如何将逗号分隔的数据帧单元格中的值转换为Julia中的数组？

如何将单独的int值转换为十六进制字节数组

如何将数组项转换为SnapLogic中的对象

在Gatling / Scala中，如何将jsonPath转换为数组？

如何将JSON数组转换为Postgres中的行

如何将JS中的数组转换为这种格式

如何将数组中的字段转换为单个对象

如何将CSS代码转换为JavaScript中的数组

如何将数组对象转换为JavaScript中的参数

如何将多维数组转换为对象中的arr

如何将Mongodb文档中的数组转换为JsonArray

如何将变量中的值转换为数组索引

如何将数组转换为 PHP 中的函数？

如何将csv中的行转换为double数组？

如何将 json 数组转换为 postgresql 中的行

TOP 榜单

文章

如何将df单元中的数组转换为单独的列名？

如何将df单元中的数组转换为单独的列名？

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Java Eclipse中的错误13，如何解决？

在Windows 7中无法删除文件（2）

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

套接字无法检测到断开连接

带有错误“ where”条件的查询如何返回结果？

有什么解决方案可以将android设备用作Cast Receiver？

Mac OS X更新后的GRUB 2问题

ggplot：对齐多个分面图-所有大小不同的分面

验证REST API参数

如何从视图一次更新多行（ASP.NET - Core）

尝试反复更改屏幕上按钮的位置 - kotlin android studio

计算数据帧中每行的NA

检索角度选择div的当前值

离子动态工具栏背景色

UITableView的项目向下滚动后更改颜色，然后快速备份

VB.net将2条特定行导出到DataGridView

蓝屏死机没有修复解决方案

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException