使用 Python 和 Boto3 从 S3 读取多个 CSV 文件

库马尔·高拉夫

我能够使用 python 中的 boto3 从 S3 存储桶中读取多个 csv 文件,并最终将这些文件合并到 Pandas 中的单个数据框中。但是,在某些文件夹中,有一些空文件会导致错误“没有要从文件中解析的列” ”。我们可以跳过下面代码中的那些空文件吗?

s3 = boto3.resource('s3')
bucket = s3.Bucket('testbucket')

prefix_objs = bucket.objects.filter(Prefix="extracted/abc")

    prefix_df = []

for obj in prefix_objs:
    key = obj.key
    body = obj.get()['Body'].read()
    temp = pd.read_csv(io.BytesIO(body),header=None, encoding='utf8',sep=',')        
    prefix_df.append(temp)

我用过这个 ans [https://stackoverflow.com/questions/52855221/reading-multiple-csv-files-from-s3-bucket-with-boto3][1]

扳手
s3 = boto3.resource('s3')
bucket = s3.Bucket('testbucket')

prefix_objs = bucket.objects.filter(Prefix="extracted/abc")

prefix_df = []

for obj in prefix_objs:
    try:
        key = obj.key
        body = obj.get()['Body'].read()
        temp = pd.read_csv(io.BytesIO(body),header=None, encoding='utf8',sep=',')        
        prefix_df.append(temp)
    except:
        continue

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何使用lambda函数和boto3从s3存储桶读取csv文件?

使用boto3和python从Amazon s3读取zip文件

使用boto3和python从S3存储桶目录中仅读取特定格式的文件

使用boto3,Python从S3存储桶中查找最新的CSV文件

使用boto3 python计算s3中csv文件的行

在lambda中使用boto3从s3读取和写入excel文件

使用python和boto3将s3中的文件公开

使用 boto3 和 python flask 将 CSV 文件上传到 S3 存储桶时出现错误 500

使用Boto和Pandas从AWS S3读取CSV文件

从带有boto3和Python 3.7的AWS S3的特定“子目录”下载多个文件

尝试使用python2.7中的boto3模块从S3存储桶和S3存储桶获取CSV文件时出现无效的时间戳记错误

使用 Boto3 和 Python 将 tar.gz 文件上传到 S3 存储桶

使用boto3将csv文件保存到s3

如何在S3 boto3中删除多个文件和特定模式

使用Ajax和Boto3 for Django将文件上传到S3

使用boto3和回调跟踪S3文件的下载进度

Python AWS Boto3:如何从S3存储桶读取文件?

使用Boto3从S3存储桶读取文件内容

如何使用Boto3从Amazon S3读取大型JSON文件

使用python boto3使用s3和cloudfront部署静态站点

如何使用 lambda、boto3 和 python 2.7 检查 s3 的顶级文件夹中是否存在特定文件

如何使用python和boto3将Amazon S3文件下载到文件夹中的本地机器上?

使用 boto3 和 python 列出 s3 存儲桶

列出使用Python和Boto3的S3存储桶的目录内容吗?

如何读取目录中的多个文件,这些文件都是带有Airflow S3 Hook或boto3的csv.gzip?

如何将S3存储桶中的选定文件转换为雪花阶段,以便使用python和boto3将数据加载到雪花中

使用 boto3 上传文件到 S3

如何使用Python在myBucket中上传CSV文件并在S3 AWS中读取文件

如何使用 C# 从 S3 存储桶读取和处理大型文本/CSV 文件?