当我们导入一个jar到pyspark shell时后台会发生什么

吉斯

我知道 pyspark shell 使用 Python 解释器。如何将 jar 导入其中?后台发生了什么使这成为可能?

用户10111189

简而言之,什么都没有,因为您只需将 jar 导入Python 解释器(好吧,除非您使用 Jython,但那是另一回事)。

在 PySpark 中,Python 解释器使用套接字与 JVM 通信。

  • Python 序列化数据(它的某种形式)或命令,并通过套接字将其发送到 JVM 进程。
  • JVM 进程反序列化事物,决定如何处理它,计算结果并通过套接字将其发送到 Python 解释器。

如果发生任何来自 jar 的导入,它会在 JVM 的“自然”环境中发生。

它使用的特定工具是Py4j,因此您可以通过对实现细节感兴趣的方式来检查它,但其他类似的工具也存在。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

当我创建一个自动属性时,后台会发生什么?

当我们给一个名字分配一个函数时,内部会发生什么?

当我们git checkout一个提交时会发生什么

当我们将char *转换为int *时,在后台或内存中会发生什么

当我们导入一个函数时,是否有可能避免多个 ../ ?

当我们重置一个 shared_ptr 时,如果有其他的 shared_ptr 别名构造了它,会发生什么?

春季:当我们将@ComponentScan移到包中的另一个类时会发生什么?

我们初始化主对象,并在其构造函数中创建一个新对象。当我们摧毁主要物体时,它的创作会发生什么?

当我们从另一个char整数减去一个char整数时会发生什么?

当我们在微任务队列中返回一个值并从 then() 链返回一个 Promise.resolve 时会发生什么?

当我们有一个红色区域时,为什么我们需要堆栈分配?

当我们释放一个按钮时,如何触发一个事件?

当我在shell中执行文件时,会发生什么情况?

当我们使用交互式rebase时,原始提交会发生什么?

当我们向下转换时,内部会发生什么?

当我们向GPIO写入0时会发生什么

当我们在 Promise 被解决之前调用 .then 时到底会发生什么?

当我们有多个 Java 线程时,运行时会发生什么?

当我们更改 hive 中的表时,后端会发生什么

当我们将 2 个值分配给同一个变量时会发生什么?

当我们在一个项目中绑定对象并从第二个项目中查找时,不会发生JNDI查找

当我们将jar提交给风暴集群时会发生什么情况?

当我们在@Bean中创建新类并在另一个@Bean中在@Bean中使用时会发生什么?

当我们在 kubernetes 中创建具有多个副本和一个 pvc 的状态集时会发生什么?

在angular 2上,当我从一个大库中仅导入一个模块时,构建时会发生什么?

当 inferschema 设置为 True 时,Pyspark 如何自动确定列的数据类型,后台会发生什么

在 Oracle 19c 数据库中,当我们删除一个表时,使用该表的过程、触发器、索引会发生什么变化?

当我们说一个ArrayList不同步是什么意思?

当我们只有一个片段时处理 `BackPressed`