AWS Lambda：如何在S3存储桶中读取CSV文件，然后将其上传到另一个S3存储桶？

sarah 发表于 Dev

109

莎拉

我正在做一个项目，在该项目中，我从S3存储桶中读取文件并删除所有NA值，然后将它们上传到其他S3存储桶中。我一直在看Lambda教程和示例代码，但是我很难理解它是如何工作的。
我的目标是读取S3存储桶中的任何文件，并使用Lambda函数，删除所有NA值，然后将它们上传到其他S3存储桶。但是我真的不明白发生了什么。我阅读了文档，但对我的理解不是很有帮助。
如何使以下代码从S3存储桶中读取CSV文件，然后删除所有NA值，然后将它们上传到新的S3存储桶中？

import json
import os
import boto3
import csv

def lambda_handler(event, context):
    
    for record in event['Records']:
        
        bucket = record['s3']['bucket']['name']
        file_key = record['s3']['object']['key']
        s3 = boto3.client('s3')
        
        csv_file = s3.get_object(Bucket=bucket, Key=file_key)
        csv_content = csv_file['Body'].read().split(b'\n')
        
        csv_data = csv.DictReader(csv_content)

任何链接到文档，或视频和建议，将不胜感激。

萨姆托德勒

上载档案

def upload_file(file_name, bucket, object_name=None):
    """Upload a file to an S3 bucket

    :param file_name: File to upload
    :param bucket: Bucket to upload to
    :param object_name: S3 object name. If not specified then file_name is used
    :return: True if file was uploaded, else False
    """

    # If S3 object_name was not specified, use file_name
    if object_name is None:
        object_name = file_name

    # Upload the file
    s3_client = boto3.client('s3')
    try:
        response = s3_client.upload_file(file_name, bucket, object_name)
    except ClientError as e:
        logging.error(e)
        return False
    return True

s3下载文件

import boto3
s3 = boto3.resource('s3')
s3.meta.client.download_file('mybucket', 'hello.txt', '/tmp/hello.txt')

现在，您只需以所需的任何方式处理这些csv文件，然后以高效的方式处理和上传到s3，这将是完全不同的主题。

这篇文章中有很多答案。如何使用boto将文件上传到S3存储桶中的目录

如果好奇，您也可以选中此复选框，以了解如何处理较大的文件。

步骤4：创建用于拆分输入数据的Lambda函数

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-02-19

我来说两句

0 条评论

登录后参与评论

上一篇：在熊猫中使用单独的时间戳列进行最小/最大分组

TOP 榜单

文章

AWS Lambda：如何在S3存储桶中读取CSV文件，然后将其上传到另一个S3存储桶？

AWS Lambda：如何在S3存储桶中读取CSV文件，然后将其上传到另一个S3存储桶？

UITableView的项目向下滚动后更改颜色，然后快速备份

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Mac OS X更新后的GRUB 2问题

验证REST API参数

Java Eclipse中的错误13，如何解决？

带有错误“ where”条件的查询如何返回结果？

ggplot：对齐多个分面图-所有大小不同的分面

尝试反复更改屏幕上按钮的位置 - kotlin android studio

如何从视图一次更新多行（ASP.NET - Core）

计算数据帧中每行的NA

蓝屏死机没有修复解决方案

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

离子动态工具栏背景色

VB.net将2条特定行导出到DataGridView

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

在Windows 7中无法删除文件（2）

python中的boto3文件上传

当我尝试下载 StanfordNLP en 模型时，出现错误

Node.js中未捕获的异常错误，发生调用