使用Glue从AWS RDS到S3的管道

伊尚克·in那

我正在尝试AWS Glue将当前数据管道从python脚本迁移到AWS Glue。我能够设置一个搜寻器来为不同的postgres数据库提取模式。但是,在将数据从Postgres RDS提取到Athena中的S3表时,我遇到了问题。

  • 有没有一种方法可以将数据从AWS RDS直接拉到Athena中的S3表?
  • 如果是,那么如何
  • 如果没有,那么总是欢迎任何更好的建议

提前致谢 !

Tanveer uddin

您无法使用Athena将数据从AWS RDS拉至S3。雅典娜是一个基于S3数据的查询引擎。为了能够将数据从RDS提取到S3,您可以运行Glue作业以从特定的RDS表中读取数据,并以镶木地板格式创建S3转储,这将创建另一个指向S3数据的外部表。然后,您可以使用Athena查询该S3数据。使用Glue目录从RDS读取并在S3中写入拼花的示例代码片段如下所示。有一些Glue预定义模板可用于实验。首先从一张小桌子开始。请告诉我它是否适合您或其他问题/问题。

datasource0 = glueContext.create_dynamic_frame.from_options(connection_type="postgresql", connection_options = 
{"url": "jdbc-url/database",
"user": "user_name",
"password": "password",
"dbtable": "table_name"},
transformation_ctx = "datasource0")

   datasink4 = glueContext.write_dynamic_frame.from_options(frame = datasource0, connection_type = "s3", connection_options = {"path": "s3://aws-glue-tpcds-parquet/"+ tableName + "/"}, format = "parquet", transformation_ctx = "datasink4")

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

使用Glue将数据从RDS移至S3

用于从s3自动还原到rds的AWS Lambda

使用 AWS Glue 将 AWS Redshift 转换为 S3 Parquet 文件

使用KMS将AWS RDS Aurora选择到S3加密存储桶中

使用 Bitbucket 管道将网站持续部署到 AWS S3

AWS Glue 将数据从 RDS(需要从所有架构同步 4 个表)到 S3(apache parque 格式)

AWS-使用aws_s3扩展名(由RDS提供)的S3到RDS(postgres)导入失败

使用 AWS Glue 從 S3 讀取動態 DataTpes

使用Scala中的AWS Glue在S3中加载CSV文件

何时使用 Amazon Redshift 频谱通过 AWS Glue ETL 查询 Amazon S3 数据

使用Glue将数据输入到AWS Elastic Search

AWS Glue - 如何使用 BOTO3 更改 Glue Catalog 表中的列名称?

从 AWS Glue 到 RDS 的 JDBC 连接超时

AWS 数据管道:将数据转储到 3 个 s3 节点

是否可以使用AWS Data Pipeline将RDS数据库转储到S3?

直接使用pg_dump的RDS到S3(无中介)

Bitbucket管道,在NodeJS脚本中使用ENV VARS部署到S3 Deploy

使用Amazon数据管道将dynamoDB数据备份到S3

AWS Glue 抓取动态 S3 路径位置

通过Crontab将AWS数据库备份RDS复制到S3(Cron Job)

使用 Spark 和 AWS Glue 在本地实现从 Kinesis 移动数据 -> RDS

AWS Glue:如何将S3存储桶分区到多个红移表中

AWS Codepipeline 使用 --delete 标志部署到 S3

使用laravel将文件存储到AWS S3

如何使用boto3更改由AWS Glue搜寻器创建的表的名称

如何使用Glue读取多个S3存储桶?

使用代码管道在AWS S3上部署Angular 7应用程序时出错

S3使用Jenkins管道复制工件

从 S3 解压缩文件并将其写回 S3 的 AWS Glue 作业