如何使用 Spark SQL 对均值列进行排序?

金属牧师

我正在通过使用groupBymean函数找到平均值,就像这样。

x.groupBy("Col1", "Col2" "Col3").mean("Col4")

但是,我稍后还想对列进行排序。我怎样才能做到这一点?我知道我们可以使用该orderBy函数对列进行排序,但这只能用于带有名称的列,而我们没有任何带有方式的列的名称。

我尝试了以下方法,但不起作用。

x.groupBy("Col1", "Col2" "Col3").mean("Col4").alias("Mean").orderBy("Mean")

我也试过as代替alias,但这也不起作用。

蓝羊令牌

您可以使用as.

所以这个名字在运行时是已知的!

x.groupBy("Col1", "Col2" "Col3").agg(mean("Col4").as("CustomName"))

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何使用Spark Sql进行递归查询

如何在不使用Spark SQL的情况下在Spark中对数据帧进行排序?

如何在Spark SQL中找到分组的Vector列的均值?

如何在Spark SQL中按列降序排序?

如何使用两列对SQL查询进行排序?

如何在Spark SQL中对多个列进行透视?

如何使用Spark SQL Scala在列中拆分geojson数据

SPARK SQL:如何按多个列过滤记录并使用 groupBy

如何使用Java在Spark SQL中联接多个列以在DataFrame中进行过滤

如何对 spark.rdd 中的列进行分组和排序

使用Spark SQL进行条件滞后求和

如何在数据块中使用 Spark sql 连接 spark 数据帧列

如何使用pyspark对spark数据框中的仅一列进行排序?

如何在Spark中使用日期和时间值对列进行排序?

如何根据另一个表中的平均值对SQL表进行排序

使用Spark SQL获取或默认嵌套列

如何使用值对我的Spark元组进行排序以降序

如何掌握spark sql

如何根据日期对SQL Server中的多列进行排序

如何使用Spark SQL广播功能

如何使用spark sql运行hql脚本?

如何使用Spark SQL获取多个表

使用Spark SQL分类

使用多个列进行排序的SQL Rank语法

如何在Spark SQL中使用连字符对列名进行转义

Scala Spark DataFrame SQL withColumn-如何使用函数(x:String)进行转换

如何使用Spark Scala或sql对特定时间间隔内的记录进行分组?

如何使用C#对SQL Server中的字母数字列进行排序?

如何验证 Dataframe 中的特定列而不使用 spark-sql 干扰其他列?