我们知道在spark中有一个方法rdd.collect将RDD转换为列表。
List<String> f= rdd.collect();
String[] array = f.toArray(new String[f.size()]);
我正在尝试在我的项目中做相反的事情。我有一个要转换为JavaRDD的String的ArrayList。我在寻找这种解决方案已有相当一段时间,但没有找到答案。有人可以帮我吗?
您在寻找JavaSparkContext.parallelize(List)
和类似。就像在Scala API中一样。
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句