jupyter笔记本电脑干扰了火花提交

杰里汀

我在OS X上预先安装了Hadoop并安装了Spark，并与Jupyter Notebook集成了PySpark。基本上，我会在终端Jupyter Notebook弹出窗口中输入“ pyspark”。一切正常。

但是当我通过以下命令使用spark-sumit时：

spark-submit --master local[*] --total-executor-cores 1 --driver-memory 2g server.py

我收到一个错误：

jupyter: '/Users/XXX/some_path/server.py' is not a Jupyter command

似乎Jupyter会干扰火花放电。这是我的bash_profile：

export PATH="/Users/XXX/anaconda/bin:$PATH"
export PATH="/Users/XXX/Spark/spark-2.0.2-bin-hadoop2.6/bin:$PATH"
export SPARK_HOME="/Users/XXX/Spark/spark-2.0.2-bin-hadoop2.6"
export PYSPARK_PYTHON=/Users/XXX/anaconda/bin/python2.7
export PYSPARK_DRIVER_PYTHON=/Users/XXX/anaconda/bin/jupyter
export PYSPARK_DRIVER_PYTHON_OPTS='notebook'

我知道这一定是我的环境变量的问题。当我删除最后两行时，它起作用了。我按照这个问题的答案使用Apache Spark Submit提交Python应用程序，在我的情况下，这些方法都无效。也有人说未设置PYSPARK_DRIVER_PYTHON，PYSPARK_DRIVER_PYTHON_OPTS然后再提交就可以了。

是否有更好的方法设置环境变量，以便在键入时也可以使用Jupyer Notebookpyspark并可以使用spark-submit？

任何想法都会有所帮助。

马里乌斯

当然，您可以创建包含以下内容的脚本：

$!/usr/bin/bash
export PYSPARK_DRIVER_PYTHON=/Users/XXX/anaconda/bin/jupyter
export PYSPARK_DRIVER_PYTHON_OPTS='notebook'
exec pyspark

并将其命名为pyspark-jupyterbash内的某个位置$PATH，它应该可以按预期工作。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-05-28

我来说两句

0 条评论

登录后参与评论

上一篇：为什么kibana的可视化图表中的唯一计数不正确？

TOP 榜单

文章

jupyter笔记本电脑干扰了火花提交

jupyter笔记本电脑干扰了火花提交

UITableView的项目向下滚动后更改颜色，然后快速备份

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Mac OS X更新后的GRUB 2问题

验证REST API参数

Java Eclipse中的错误13，如何解决？

带有错误“ where”条件的查询如何返回结果？

ggplot：对齐多个分面图-所有大小不同的分面

尝试反复更改屏幕上按钮的位置 - kotlin android studio

如何从视图一次更新多行（ASP.NET - Core）

计算数据帧中每行的NA

蓝屏死机没有修复解决方案

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

离子动态工具栏背景色

VB.net将2条特定行导出到DataGridView

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

在Windows 7中无法删除文件（2）

python中的boto3文件上传

当我尝试下载 StanfordNLP en 模型时，出现错误

Node.js中未捕获的异常错误，发生调用