在Python中读取.tar.gz文件

KrunalParmar:

我有一个25GB的文本文件。所以我将其压缩为tar.gz,它变为450 MB。现在我想从python中读取该文件并处理文本数据。为此,我提到了问题但就我而言,代码不起作用。代码如下:

import tarfile
import numpy as np 

tar = tarfile.open("filename.tar.gz", "r:gz")
for member in tar.getmembers():
     f=tar.extractfile(member)
     content = f.read()
     Data = np.loadtxt(content)

错误如下:

Traceback (most recent call last):
  File "dataExtPlot.py", line 21, in <module>
    content = f.read()
AttributeError: 'NoneType' object has no attribute 'read'

另外,还有其他方法可以执行此任务吗?

雷蒙德·海廷格(Raymond Hettinger):

文件告诉我们,没有被返回extractfile()如果该成员是不是一个普通的文件或链接。

一种可能的解决方案是跳过“ 无”结果:

tar = tarfile.open("filename.tar.gz", "r:gz")
for member in tar.getmembers():
     f = tar.extractfile(member)
     if f is not None:
         content = f.read()

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何在python中的(MB)文件中获取tar.gz的大小

如何完全从Java中的内存(无文件)中的对象创建tar或tar.gz存档

Ruby-列出tar.gz档案中的文件

如何从tar.gz存档中删除单个文件

从Nim中的tar.gz存档中读取文件

如何重命名.tar.gz文件而不提取内容并在UBUNTU中创建新的.tar.gz文件?

提取.gz文件中的.TAR文件

在python中,如果解压缩tar.gz文件,如何获取或设置结果文件的名称

在不提取的情况下在python中读取* .tar.gz文件

解压缩.gz文件并将其存储在.tar.gz档案中

如何从tar.gz中仅提取所需的文件?

Python 3:从tar.gz存档中提取文件

在setup.py中包含本地tar.gz文件

如何从github R包中获取tar.gz文件

在Pyspark中读取tar.gz存档时使用特定模式过滤文件

从网站将.tar.gz文件的内容读取到python 3.x对象中

如何在Windows中打开.tar.gz文件?

从“发送到”批处理文件到“ .tar.gz”文件中快速执行“ tar -cf”命令

tar.gz在压缩之前或之后将gzip文件压缩到tar中吗?

脚本中的sed创建了损坏的.tar.gz文件

排除tar.gz中的文件

如何在C#中创建tar.gz文件

文件夹中的tar + gz文件,不放入所有子文件夹中

提取不同子目录中的.tar.gz文件

如何处理 tar.gz 中的 .desktop 文件

使用 python setup.py install 在 dist 文件夹中创建 tar.gz

如何使用 Python 在 flat tar.gz 中保存 tar 文件

R:从 tar.gz 目录中读取单个文件

从python中的tar存档中提取压缩的gz文件