如何使用s3fs处理大文件？

伊塞芬奇

我正在研究AWS EMR集群。我的S3储存装置上有资料。清理数据后，我将通过s3fs库再次发送到S3存储。该代码适用于大小在200-500 mb之间的文件。但是，当我在2.0和2.5 GB大小之间上传时。该代码给出了一个错误，即“ MemoryError”。你们对这个问题有任何想法或经验吗？

import s3fs
bytes_to_write = nyc_green_20161.to_csv(None).encode()
fs = s3fs.S3FileSystem(key='#', secret='#')
with fs.open('s3://ludditiesnyctaxi/new/2016/yellow/yellow_1.csv', 'wb') as f:
f.write(bytes_to_write)

伊塞芬奇

我处理此问题以拆分我的csv文件。这篇文章解释了如何在python中拆分csv文件并将一个csv拆分为多个文件

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-12-2

我来说两句

0 条评论

登录后参与评论

Pyarrow s3fs按时间戳划分

熊猫数据框上的s3fs gzip压缩

s3fs将Amazon S3存储桶作为本地目录挂载的稳定性如何

使用Nifi处理大文件

通过Golang SDK将大文件发送到Amazon S3时如何使用较少的内存？

Node.js使用fs.readFileSync读取大文件

使用Spring Batch处理大文件

s3fs自定义端点网址

跟踪S3成本（S3FS）

在Amazon CentOS上使用s3fs自动安装S3存储桶

s3fs在/ tmp中缓存什么？

Python AWS S3FS API：手动设置代理服务器

NotImplementedError：不支持文本模式，使用mode ='wb'并管理s3fs中的字节

ImportError：缺少可选依赖项“ S3F”。需要S3Fs软件包才能处理S3文件。使用pip或conda安装S3F

s3fs和ubuntu的文件权限

使用NodeJS和S3FS / multiparty将文件上传到Amazon S3

使用s3fs更新日志文件

使用Tcl处理大文件

Git LFS如何处理大文件？

使用 s3fs 安装 S3 存储桶的问题

如何使用 S3FS 挂载 AWS s3 以允许对任何用户进行完全访问

使用 s3fs 下载文件

在 RHEL 6 系统上安装 S3FS 的问题

当我没有使用 Docker 的 Js 时，为什么 s3fs 显示“无效选项 -- 'j'”？

使用 Laravel 将大文件上传到 S3？

s3fs：如何使用 IMDS v2 在代理后面的 AWS EC2 实例上挂载 S3 存储桶

使用 python 和 pandas 处理大文件

什么相当于使用 s3fs 在 aws s3 中连接到谷歌云存储（gcs）？

TOP 榜单

文章

如何使用s3fs处理大文件？

如何使用s3fs处理大文件？

Linux的官方Adobe Flash存储库是否已过时？

如何使用HttpClient的在使用SSL证书，无论多么“糟糕”是

错误：“ javac”未被识别为内部或外部命令，

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

Modbus Python施耐德PM5300

为什么Object.hashCode（）不遵循Java代码约定

如何检查字符串输入的格式

检查嵌套列表中的长度是否相同

错误TS2365：运算符'！=='无法应用于类型'“（”'和'“）”'

如何自动选择正确的键盘布局？-仅具有一个键盘布局

如何正确比较 scala.xml 节点？

在令牌内联程序集错误之前预期为 ')'

如何在JavaScript中获取数组的第n个元素？

如何将sklearn.naive_bayes与（多个）分类功能一起使用？

ValueError：尝试同时迭代两个列表时，解包的值太多（预期为 2）

如何监视应用程序而不是单个进程的CPU使用率？

解决类Koin的实例时出错

ES5的代理替代

有什么解决方案可以将android设备用作Cast Receiver？

VBA 自动化错误：-2147221080 (800401a8)

套接字无法检测到断开连接