无法从Spark连接到AWS Elasticsearch

sfbay 发表于 Dev

118

sfbay

我需要使用AWS访问/秘密密钥从我的Spark应用程序（结构化流）连接到AWS Elasticsearch服务。例如，S3和Spark集成提供了一种在配置https://docs.databricks.com/spark/latest/data-sources/aws/amazon-s3.html中设置访问/秘密密钥的方法

我找不到与Elasticsearch等效的东西。我尝试了下面的代码，但是没有用。

 val writer = input.write
        .option("es.nodes",serverUrl)
        .option("es.net.https.auth.user", awsAccessKeyId)
        .option("es.net.https.auth.pass", awsSecretAccessKey)
        .option("es.nodes.wan.only", "true")
        .format("org.elasticsearch.spark.sql")
  writer.save("index/mapping")

看起来像“ es.net.https.auth.xxx”用于基本身份验证。我正在寻找特定于AWS的产品。任何信息表示赞赏！

拉姆·加迪亚拉姆

awsAccessKeyId awsSecretAccessKey如果您可以通过aws访问您的spark集群，则将与spark会话一起传播。

测试是，使用Spark Shell尝试从s3中读取包含示例镶木地板文件的存储桶。

http auth用户和密码是占位符 es.net.https.auth.user es.net.https.auth.pass

例如，如果要连接到mysql（RDS为aws），则需要分别传递jdbc用户名和密码。类似的术语，您的http身份验证也是如此。

结论：

根据我的经验，不需要单独提供awsAccessKeyId和awsSecretAccessKey，因为它的隐式访问可以从EMR群集进行。

注意：如果您想要或必须真正设置访问凭证，则需要如下设置。

val hadoopConf = sc.hadoopConfiguration;
hadoopConf.set("fs.s3.impl", "org.apache.hadoop.fs.s3native.NativeS3FileSystem")
hadoopConf.set("fs.s3.awsAccessKeyId", myAccessKey)
hadoopConf.set("fs.s3.awsSecretAccessKey", mySecretKey)

不喜欢

.option("es.net.https.auth.user", awsAccessKeyId)

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-15

我来说两句

0 条评论

登录后参与评论

如何连接到AWS Elasticsearch？

filebeat 无法连接到elasticsearch

Elasticsearch问题：无法连接AWS Elasticsearch服务

Kibana无法在Docker上连接到Elasticsearch

Packetbeat 无法连接到 elasticsearch docker

Docker上的Kibana无法连接到Elasticsearch

无法将Kibana连接到Elasticsearch

无法在 Docker 中连接到 Elasticsearch

无法连接到 GetCandy 内的 ElasticSearch

如何使用Elasticsearch JavaScript SDK连接到AWS Elasticsearch？

Kibana将无法连接到Amazon Elasticsearch Service上的Elasticsearch

NodeJs 连接到 elasticsearch

如何将Elasticsearch连接到Apache Spark Streaming或Storm？

使用关键凭证连接到AWS中的Elasticsearch

如何使用npm elasticsearch和http-aws-es连接到AWS ElasticSearch？

Elasticsearch Interpreter 无法连接到数据库

无法连接到我的Elasticsearch实例：NoNodeAvailableException

Spring Boot 2.0无法连接到ElasticSearch 5.5.0-NoNodeAvailableException

集群名称更改后，JanusGraph 无法连接到 ElasticSearch

Graylog 无法连接到 Kubernetes 集群中的 Elasticsearch

无法在Docker中使用PHP连接到Elasticsearch

无法连接到我的代理elasticsearch节点

无法使用docker-compose连接到kibana / elasticsearch

无法使用 Docker-Compose 中的图像连接到 Elasticsearch

AWS Elasticsearch VPC连接

连接到ElasticSearch的Kibana问题

Kibana未连接到ElasticSearch

将 Elasticsearch 连接到 Kibana

将NiFi连接到ElasticSearch

TOP 榜单

文章

无法从Spark连接到AWS Elasticsearch

无法从Spark连接到AWS Elasticsearch

Linux的官方Adobe Flash存储库是否已过时？

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

如何检查字符串输入的格式

如何使用HttpClient的在使用SSL证书，无论多么“糟糕”是

Modbus Python施耐德PM5300

错误TS2365：运算符'！=='无法应用于类型'“（”'和'“）”'

用日期数据透视表和日期顺序查询

检查嵌套列表中的长度是否相同

Java Eclipse中的错误13，如何解决？

ValueError：尝试同时迭代两个列表时，解包的值太多（预期为 2）

如何监视应用程序而不是单个进程的CPU使用率？

如何自动选择正确的键盘布局？-仅具有一个键盘布局

ES5的代理替代

在令牌内联程序集错误之前预期为 ')'

有什么解决方案可以将android设备用作Cast Receiver？

套接字无法检测到断开连接

如何在JavaScript中获取数组的第n个元素？

如何将sklearn.naive_bayes与（多个）分类功能一起使用？

应用发明者仅从列表中选择一个随机项一次

在Windows 7中无法删除文件（2）

ggplot：对齐多个分面图-所有大小不同的分面