在独立Spark上连接到远程主服务器

吃豆人

我通过以下步骤在远程服务器上以独立模式启动Spark:

  • cp spark-env.sh.template spark-env.sh
  • 附加到 spark-env.sh SPARK_MASTER_HOST=IP_OF_MY_REMOTE_SERVER
  • 并在独立模式下运行以下命令: sbin/start-master.sh sbin/start-slave.sh spark://IP_OF_MY_REMOTE_SERVER:7077

我尝试连接到远程主服务器:

val spark = SparkSession.builder()
  .appName("SparkSample")
  .master("spark://IP_OF_MY_REMOTE_SERVER:7077")
  .getOrCreate()

而且我收到以下错误:

ERROR SparkContext: Error initializing SparkContext.
java.net.BindException: Cannot assign requested address: Service 'sparkDriver' failed after 16 retries!

和警告:

    WARN Utils: Service 'sparkMaster' could not bind on port 7077. Attempting port 7078.
.....
    WARN Utils: Service 'sparkMaster' could not bind on port 7092. Attempting port 7092.
加伦·S

我建议不要使用端口开放策略远程提交spark作业,因为它可能会导致安全问题,并且据我所知,这比值得的麻烦还多,尤其是由于必须对通信层进行故障排除。

备择方案:

1)Livy-现在是一个Apache项目!http://livy.iohttp://livy.incubator.apache.org/

2)Spark Job服务器-https: //github.com/spark-jobserver/spark-jobserver

类似的问答:远程将作业提交到Spark EC2集群

如果您坚持不使用Livy之类的库进行连接,那么请打开端口以确保需要通信。Spark网络通讯文档:http//spark.apache.org/docs/latest/security.html#configuring-ports-for-network-security

由于您未使用YARN(根据您的独立设计),因此到YARN远程提交的先前链接可能不相关。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

spark-shell无法连接到远程主服务器

如何从Spark连接到远程Hive服务器

无法连接到远程服务器上的mongo

无法连接到远程服务器上的mongo

SSH连接到远程服务器上的GitHub

连接到Cygwin上的远程MySQl服务器

连接到远程mongoDB服务器

远程连接到Ksql服务器

连接到远程mongo服务器

连接到远程mysql服务器

PgAdmin连接到远程服务器

无法连接到服务器:连接被拒绝(0x0000274D / 10061)-远程服务器上的PostgreSQL

EXEC:无法连接到TFS构建服务器上NuGet还原上的远程服务器

将Linux服务器上的PHP连接到运行Windows的远程服务器上的MS SQL

Worker无法在Spark Apache中连接到主服务器

远程连接到 PCF 云配置服务器服务

如何连接到moto独立服务器?

PC上的本地apache服务器-PHP无法连接到其他远程服务器

使用远程服务器上的LdapConnection类连接到Active Directory

无法在Mac上使用MySQL Workbench连接到远程服务器

将本地机器上的 SSIS 连接到远程服务器 oracle 数据库

尝试将Pyftpsync连接到端口22上的远程服务器时出现EFOError

从远程服务器连接到Amazon EC2上的mysql-错误2003

如何连接到远程服务器IIS上的已发布网站

如果通过SSH连接到它的PC关闭,则远程服务器上的Java进程终止

HttpException: -404 运行 Docker 时无法连接到 mac 上的远程服务器

Docker容器无法连接到远程服务器上的SQL Server

无法连接到AWS上的远程MySQL服务器,但ssh隧道有效

调试-IntelliJ无法连接到远程服务器上启用调试的JVM