AWS Glue作业以实木复合地板格式写入s3错误,未找到

费尔南多·冈萨雷斯

我一直在创建pyspark作业,并且不断收到一个类似的间歇性错误(更像是随机错误):

An error occurred while calling o129.parquet. Not Found 
(Service: Amazon S3; Status Code: 404; Error Code: 404 Not Found; 
Request ID: D2FA355F92AF8F05; S3 Extended Request ID: 1/fWdf1DurwPDP40HDGARlMRO/7lKzFDJ4g7DbUnM04wUvG89CG9w5T+u4UxapkWp20MfQfdjsE=)

我什至没有读过s3,我实际上正在做的是: df.coalesce(100).write.partitionBy("mth").mode("overwrite").parquet("s3://"+bucket+"/"+path+"/out")

因此,我更改了coalesce分区,但是我不确定应该采取什么其他措施来减轻此错误并使我的工作更稳定。

杰伊·卡卡迪亚(Jay Kakadiya)

使用胶水从s3中读取文件

datasource0 = glueContext.create_dynamic_frame.from_options( connection_type = "s3", connection_options = {"paths": "s3/path"}, format = "json", transformation_ctx = "datasource0")

使用胶水将文件写入s3

output = glueContext.write_dynamic_frame.from_options(frame = df, connection_type = "s3", connection_options = {"path": "s3/path"}, format = "parquet", transformation_ctx = "output")

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

使用实木复合地板写入文件到S3 AWS的Java LAMDA

如何使用带有特定AWS配置文件的dask从s3中读取实木复合地板文件

从AWS Glue中的动态框架覆盖实木复合地板文件

将SQL Server中的数据作为实木复合地板加载到S3-AWS EMR

实木复合地板格式的Mapreduce错误

如何使用AWS Lambda将JSON文件转换为实木复合地板

在AWS Glue作业中写入S3时是否可以指定SSE:KMS密钥ID?

AWS Athena:HIVE_BAD_DATA错误:实木复合地板中的字段类型DOUBLE与表架构中定义的类型不兼容

将木条地板从AWS Kinesis firehose写入AWS S3

如何从S3读取实木复合地板数据以生成数据框Python?

在S3中的多个实木复合地板文件上创建Hive表

如何在python中使用pyarrow从S3读取分区实木复合地板文件

优化从s3存储桶中的分区实木复合地板文件读取

将S3上的实木复合地板转换为字符串

如何从S3读取单个实木复合地板文件到dask数据帧中?

如何使用pyarrow从s3中读取分区的实木复合地板文件?

SSIS将源Oledb数据发送到实木复合地板文件中的S3存储桶

Presto是否需要一个配置单元metastore来从S3中读取实木复合地板文件?

如何通过S3 Events或AWS Lambda触发Glue ETL Pyspark作业?

在AWS Glue ETL作业中从S3加载分区的json文件

处理嵌套 s3 文件夹中的分区 Parquet 文件的 AWS GLUE 作业失败

AWS Glue 作业 - 写入单个 Parquet 文件

AWS Glue 作业能否写入 SAP HANA?

使用 AWS CLI 创建 S3 QuickSight 数据源时出现“未找到清单文件”错误

无法将流写入实木复合地板水槽

实木复合地板可以支持并发写入操作吗?

读取/写入实木复合地板文件中的pyarrow张量

从 S3 解压缩文件并将其写回 S3 的 AWS Glue 作业

从Python编写嵌套的实木复合地板格式