从 AWS S3 读取数据

穆罕默德·萨杜吉

我有一些格式非常特殊的数据（例如，NI 系统生成的 tdms 文件），并将它们存储在 S3 存储桶中。通常，如果数据存储在我的本地计算机中，为了在 python 中读取这些数据，我会使用 npTDMS 包。但是，当这些 tdms 文件存储在 S3 存储桶中时，应该如何读取它们？一种解决方案是将数据下载到 EC2 实例，然后使用 npTDMS 包将数据读入 python。但这似乎不是一个完美的解决方案。有什么方法可以读取类似于从 S3 读取 CSV 文件的数据？

盖伊

一些 Python 包（例如 Pandas）支持直接从 S3 读取数据，因为它是最流行的数据位置。例如，在使用 Pandas 执行此操作的方法中，请参阅此问题。

如果包 (npTDMS) 不支持直接从 S3 读取，则应将数据复制到笔记本实例的本地磁盘。

最简单的复制方法是在笔记本的单元中运行 AWS CLI

!aws s3 cp s3://bucket_name/path_to_your_data/ data/

该命令会将S3中“文件夹”下的所有文件复制到本地文件夹 data

您可以使用 boto3 丰富的功能过滤文件和其他特定要求来使用更细粒度的副本。例如：

s3 = boto3.resource('s3')
bucket = s3.Bucket('my-bucket')
objs = bucket.objects.filter(Prefix='myprefix')
for obj in objs:
   obj.download_file(obj.key)

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-07-31

我来说两句

0 条评论

登录后参与评论

上一篇：C# 登录 XML 循环错误的密码

TOP 榜单

文章

从 AWS S3 读取数据

从 AWS S3 读取数据

Linux的官方Adobe Flash存储库是否已过时？

如何使用HttpClient的在使用SSL证书，无论多么“糟糕”是

错误：“ javac”未被识别为内部或外部命令，

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

Modbus Python施耐德PM5300

为什么Object.hashCode（）不遵循Java代码约定

如何检查字符串输入的格式

检查嵌套列表中的长度是否相同

错误TS2365：运算符'！=='无法应用于类型'“（”'和'“）”'

如何自动选择正确的键盘布局？-仅具有一个键盘布局

如何正确比较 scala.xml 节点？

在令牌内联程序集错误之前预期为 ')'

如何在JavaScript中获取数组的第n个元素？

如何将sklearn.naive_bayes与（多个）分类功能一起使用？

ValueError：尝试同时迭代两个列表时，解包的值太多（预期为 2）

如何监视应用程序而不是单个进程的CPU使用率？

解决类Koin的实例时出错

ES5的代理替代

有什么解决方案可以将android设备用作Cast Receiver？

VBA 自动化错误：-2147221080 (800401a8)

套接字无法检测到断开连接