根据其他列向pyspark数据框添加新列

卡哈

我想使用将新列添加到基于另一列的数据框WHEN我有以下代码:

from pyspark.sql.functions import col, expr, when
df2=df.withColumn("test1",when(col("Country")=="DE","EUR").when(col("Country")=="PL","PLN").otherweise("Unknown"))

但出现错误:'Column' object is not callable如何解决该问题?

Shu

的陈述中错字

  • otherweise 改成 otherwise

df=spark.createDataFrame([("DE",),("PL",),("PO",)],["Country"])
df.withColumn("test1",when(col("country") == "DE", "EUR").when(col("country") == "PL", "PLN").otherwise("Unknown")).show()
#+-------+-------+
#|Country|  test1|
#+-------+-------+
#|     DE|    EUR|
#|     PL|    PLN|
#|     PO|Unknown|
#+-------+-------+

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

根据其他数据框中的索引列表从其他数据框中向数据框中添加新列

根据其他数据框向熊猫数据框添加新列

根据列的值和来自其他数据框的值向数据框添加新的 cloumn

根据 R 中其他两列的几个条件向数据框添加新列

根据其他数据向数据添加新列

如何根据其他列向pandas数据框添加新行?

使用dplyr根据其他数据框添加新列

根据其他列向熊猫数据框添加一列

Pyspark根据其他列值添加新列

熊猫数据框根据其他列是否有数据添加新列

根据其他列中的值向数据框添加因子

根据其他列的值将新列添加到数据框

根据其他列将新列添加到Panda数据框

根据其他列的结果将新列添加到数据框

根据其他列值将新列添加到数据框

如何根据其他两列中的值在熊猫数据框中添加新列

根据其他列数据框中的值添加列

根据其他数据框中的数据添加列

使用 pyspark 向数据框添加新列的问题

根据其他数据框添加特定的列值

根据条件从其他数据框中添加列

通过合并其他列并根据先前的列名重命名,将新列添加到pandas数据框中

根据数据框的其他列创建一个新的pandas数据框列

根据R中其他数据框中是否存在值,将新值添加到新列中

向数据框添加新列

根据pyspark数据框中的其他列的值聚合一列

在数据框中添加新列并根据条件将行值更新为其他列名

根据与其他数据框的匹配更新数据框新列

Pandas 数据框根据其他 2 列的数据添加一列