如何从火花中的另一个数据框值重命名数据框列和数据类型？

高拉夫马图尔

嗨，我有两个这样的数据框：

import spark.implicits._
import org.apache.spark.sql._

val transformationDF = Seq(
  ("A_IN", "ain","String"),
  ("ADDR_HASH","addressHash","String")
).toDF("db3Column", "hudiColumn","hudiDatatype")

val addressDF=Seq(
("123","uyt"),
("124","qwe")
).toDF("A_IN", "ADDR_HASH")

现在我想重命名列并更改transformationdf中提到的值的数据类型。transformationDF中的hudicolumn名称和hudidatatype将成为addressDF的列名称和数据类型。我试过这样的代码来改变但不起作用：

var db3ColumnName:String =_
var hudiColumnName:String =_
var hudiDatatypeName:String = _

for (row <- transformationDF.rdd.collect)
{   
     db3ColumnName = row.mkString(",").split(",")(0)
      hudiColumnName= row.mkString(",").split(",")(1)
    hudiDatatypeName = row.mkString(",").split(",")(2)
    

addressDF.withColumnRenamed(db3ColumnName,hudiColumnName).withColumn(hudiColumnName,col(hudiColumnName).cast(hudiDatatypeName))
}

现在，当我打印 addressDF 时，更改不会反映出来。

谁能帮我这个。

赫里斯托·伊利耶夫

这是一个要求使用的教科书案例foldLeft：

val finalDF = transformationDF.collect.foldLeft(addressDF){ case (df, row) =>
  {
    val db3ColumnName = row.getString(0)
    val hudiColumnName = row.getString(1)
    val hudiDatatypeName = row.getString(2)

    df.withColumnRenamed(db3ColumnName, hudiColumnName)
      .withColumn(hudiColumnName, col(hudiColumnName).cast(hudiDatatypeName))
  }
}

Spark 中的数据集是不可变的，每个“修改”数据集的操作实际上都会返回一个新对象，而不会更改调用该操作的对象。上面foldLeft有效地从所有转换开始addressDF并将所有转换链接到中间对象，这些对象作为第二个参数列表中的第一个参数传递。当前迭代的返回值成为下一次迭代的输入。最后一次迭代的返回值就是foldLeft自身的返回值。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2022-04-22

我来说两句

0 条评论

登录后参与评论

上一篇：createViewクラスのdjangoテンプレートurlタグのurlパラメーターにアクセスします

TOP 榜单

文章

如何从火花中的另一个数据框值重命名数据框列和数据类型？

如何从火花中的另一个数据框值重命名数据框列和数据类型？

Android Studio Kotlin：提取为常量

IE 11中的FormData未定义

计算数据帧R中的字符串频率

如何在R中转置数据

如何使用Redux-Toolkit重置Redux Store

Excel 2016图表将增长与4个参数进行比较

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

未捕获的SyntaxError：带有Ajax帖子的意外令牌u

OpenCv：改变 putText() 的位置

ActiveModelSerializer仅显示关联的ID

算术中的c ++常量类型转换

如何开始为Ubuntu开发

将加号/减号添加到jQuery菜单

去噪自动编码器和常规自动编码器有什么区别？

获取并汇总所有关联的数据

OpenGL纹理格式的颜色错误

在 React Native Expo 中使用 react-redux 更改另一个键的值

http：// localhost：3000 /＃！/为什么我在localhost链接中得到“＃！/”。

TreeMap中的自定义排序

Redux动作正常，但减速器无效

如何对treeView的子节点进行排序