如何动态传递参数以过滤 Apache Spark 中的函数？

YRK 发表于 Dev

职业

我有一个员工文件，其中包含以下数据：

Name:   Age:
David   25
Jag     32
Paul    33
Sam     18

我加载到dataframeApache Spark 中，我正在过滤如下值：

employee_rdd=sc.textFile("employee.txt")
employee_df=employee_rdd.toDF()
employee_data = employee_df.filter("Name = 'David'").collect()

+-----------------+-------+
|            Name:|   Age:|
+-----------------+-------+
|David            |25     |
+-----------------+-------+

但是当我尝试做这样的事情时：

emp_Name='Sam' 并将此名称传递给过滤器，如下所示：

employee_data = employee_df.filter("Name = 'emp_Name'").collect

但这给了我空清单。

狗

这可以在scala中完成，您可以将其更改为python

val emp_name = "Sam"

val employee_data = employee_df.filter(col("Name") === emp_name)

希望这可以帮助！

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-06-10

我来说两句

0 条评论

登录后参与评论

上一篇：从图像的右中心使用 jquery 的图像幻灯片

在Apache Spark中传递参数

如何使用Scala将DataSet传递给在Apache Spark中接受DataFrame作为参数的函数？

如何构造可用于在 spark/scala 中映射 JavaRDD[org.apache.spark.sql.Row] 的函数？

apache spark agg（）函数

在Apache Spark中设置动态分配？

如何理解Apache Spark中的queueStream API？

如何减少EMR中Apache Spark的日志？

如何减少RDD在Apache Spark中的工作

如何在Apache Spark的RDD中传递血统

如何在Apache Spark Pipeline中打印最佳模型参数？

简单的随机采样和数据帧SAMPLE函数在Apache Spark（Scala）中如何工作？

Apache Spark中的Printschema（）

如何在 Apache Spark 中使用 saveAsTextFile() 函数？

Apache Spark过滤文件以在AWS S3中处理

在Apache Spark SQL中，如何在窗口函数中使用collect_list时删除重复的行？

Apache Beam StateSpec在Spark中

Apache Spark中的Java要求

Apache Spark中的矩阵乘法

Apache Spark中的reduce（）与fold（）

Apache Spark中的Persist选项

Apache Spark中的数据集

map（）中的Apache Spark分区

在Apache Spark中写入文件

Apache Spark中的列参考

Apache Spark如何在内存中工作？

如何在 Apache Spark Standalone Cluster 中设置文件路径？

如何在Apache Spark中重新分区CassandraRDD

如何使用apache spark在文件中写入日志

在Apache Spark SQL中，如何从HiveContext关闭元存储连接

TOP 榜单

文章

如何动态传递参数以过滤 Apache Spark 中的函数？

如何动态传递参数以过滤 Apache Spark 中的函数？

Linux的官方Adobe Flash存储库是否已过时？

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

如何检查字符串输入的格式

如何使用HttpClient的在使用SSL证书，无论多么“糟糕”是

Modbus Python施耐德PM5300

错误TS2365：运算符'！=='无法应用于类型'“（”'和'“）”'

用日期数据透视表和日期顺序查询

检查嵌套列表中的长度是否相同

Java Eclipse中的错误13，如何解决？

ValueError：尝试同时迭代两个列表时，解包的值太多（预期为 2）

如何监视应用程序而不是单个进程的CPU使用率？

如何自动选择正确的键盘布局？-仅具有一个键盘布局

ES5的代理替代

在令牌内联程序集错误之前预期为 ')'

有什么解决方案可以将android设备用作Cast Receiver？

套接字无法检测到断开连接

如何在JavaScript中获取数组的第n个元素？

如何将sklearn.naive_bayes与（多个）分类功能一起使用？

应用发明者仅从列表中选择一个随机项一次

在Windows 7中无法删除文件（2）

ggplot：对齐多个分面图-所有大小不同的分面