如何从n行到n行提取数据集内容？

Marc Le Bihan 发表于 Dev

63

马克·勒比汉

我必须将a的结果输出Dataset到Postgis（空间）数据库中。Spark无法处理它，我不得不编写无法序列化的特定代码。这意味着我不能使用dataset.foreach(...)method，我必须从外部Spark任务执行数据库插入。

但是整体
List<Row> rows = ds.collectAsList()
将产生内存不足错误。

并且a
List<Row> row = takeList();
仅返回数据集的前n行。

有没有一种方法可以顺序读取数据集，以便我可以从头到尾读取其全部内容，每次仅提取固定数量的行？

冷杉

您可以尝试randomSplit方法将数据帧拆分为多个数据帧。例如，拆分为3：

ds.randomSplit(Array(1,1,1))

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-21

我来说两句

0 条评论

登录后参与评论

上一篇：如何在Laravel的控制器中获取选定的无线电输入阵列

相关文章

如何从数据帧中提取第n行？

如何提取sql语句的第n行？

如何从单元格中的第 n 行提取所有内容？（在工作表中使用正则提取）

如何提取熊猫数据帧的第n行作为熊猫数据帧？

使用n个元素的列表从数据框中提取行

如何根据R中的ID删除数据集上的最后N行？

在 R 的数据框中删除第 n 行和从 n 到 n+ x 的行

R如何提取基于n-gram的行

如何使用数组公式提取第n行

从列表中的数据框中提取不同的行集

如何从mysql提取行到表头以及与该头相关的特定数据

如何提取与事件匹配的数据帧的行？

如何按行总和对numpy数组进行排序并提取前N行

使用LINQ，如何获得M到M + N的行？

如何从行名创建新的数据集？

如何使用数据集的特定行顺序？

如何通过行索引加入数据集？

如何更新整个数据集行？

在第n + 16处提取某些行

在 Notepad++ 中从 A 跳过 N 行后删除所有到 B 的内容（在循环中）

如何根据内容从numpy数组中提取行？

如何提取textarea内容的第一行

如何在开始的单词到'\ n'新行之间拉单词。并且在python中提取单词时有什么办法放置“ OR”条件？

使用LINQ从数据库中选择N到N行

从行到列的结构数据集 pandas python

将大型数据集组织到单独的行中

python pandas如何获取每n行和每n行的数据？

在数据框中的值之前和之后提取n行

从Matlab中的表中每隔n行提取x行

TOP 榜单

文章

热门标签

归档