如何将scala中的地图/列表解压缩为元组以实现可变函数？

jbrown 发表于 Dev

布朗

我正在尝试在spark中创建PairRDD。为此，我需要一个tuple2 RDD，例如RDD[(String, String)]。但是，我有一个RDD[Map[String, String]]。

我想不出如何摆脱可迭代的方法，所以我只剩下RDD[(String, String)]而不是例如RDD[List[(String, String)]]。

我要进行工作的一个简单演示是此损坏的代码：

val lines = sparkContext.textFile("data.txt")
val pairs = lines.map(s => Map(s -> 1))
val counts = pairs.reduceByKey((a, b) => a + b)

最后一行不起作用，因为它pairs是，RDD[Map[String, Int]]当它需要是时RDD[(String, Int)]。

那么，如何摆脱pairs上面的可迭代方法，将Map转换为tuple2呢？

罗汉·阿莱蒂（Rohan Aletty）

您实际上可以运行：

val counts = pairs.flatMap(identity).reduceByKey(_ + _)

请注意，使用身份功能复制flattenRDD上的功能，并且该reduceByKey()功能具有简洁的下划线表示法，以简化操作。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-04-7

我来说两句

0 条评论

登录后参与评论

上一篇：将节点添加到C中的链表时，EXC_BAD访问

如何在python中解压缩元组列表？

如何将元组列表解压缩到单个列表中？

如何将长度为n的元组解压缩为m <n个变量

是否可以将元组解压缩为函数参数？

方案-将列表的元素解压缩为函数

从列表解压缩的类继承

将列表解压缩到元组的中间

解压缩元组列表

将列表解压缩为python中另一个列表的索引

如何用枚举解压缩元组列表？

将地图列表解压缩到另一个地图中

在C ++ 17中解压缩可变参数元组

将字典列表解压缩到pandas数据框中的列表中

将列表解压缩为字符串，将其拆分并从中创建字典

将熊猫系列中的嵌套列表解压缩到新的DataFrame中

函数中的列表解压缩，但是用MAP（）完成时不需要吗？

python元组：使用* args解压缩为列表

将元素列表解压缩到pandas Data Frame中

将字典列表解压缩到Pandas中的单独列中

如何在python中解压缩元组列表

将列表解压缩为几种组合

如何将python中的嵌套列表解压缩为子列表？

将一个zip生成的列表解压缩到一个列表中

如何使用SQL将摘要表解压缩为单独的记录？

方案解压缩地图列表清单

通过.gz列表解压缩

尝试将顶点列表解压缩为浮点数

如何将 .zip 文件解压缩到 lambda 函数中的目录

如何在函数中解压缩可变数量参数 (*args) 的元组？

TOP 榜单

文章

如何将scala中的地图/列表解压缩为元组以实现可变函数？

如何将scala中的地图/列表解压缩为元组以实现可变函数？

蓝屏死机没有修复解决方案

计算数据帧中每行的NA

UITableView的项目向下滚动后更改颜色，然后快速备份

Node.js中未捕获的异常错误，发生调用

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

Linux的官方Adobe Flash存储库是否已过时？

验证REST API参数

ggplot：对齐多个分面图-所有大小不同的分面

Mac OS X更新后的GRUB 2问题

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

带有错误“ where”条件的查询如何返回结果？

用日期数据透视表和日期顺序查询

VB.net将2条特定行导出到DataGridView

如何从视图一次更新多行（ASP.NET - Core）

Java Eclipse中的错误13，如何解决？

尝试反复更改屏幕上按钮的位置 - kotlin android studio

离子动态工具栏背景色

应用发明者仅从列表中选择一个随机项一次

当我尝试下载 StanfordNLP en 模型时，出现错误

python中的boto3文件上传

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID