在Python中读取.tar.gz文件

KrunalParmar:

我有一个25GB的文本文件。所以我将其压缩为tar.gz,它变为450 MB。现在我想从python中读取该文件并处理文本数据。为此,我提到了问题但就我而言,代码不起作用。代码如下:

import tarfile
import numpy as np 

tar = tarfile.open("filename.tar.gz", "r:gz")
for member in tar.getmembers():
     f=tar.extractfile(member)
     content = f.read()
     Data = np.loadtxt(content)

错误如下:

Traceback (most recent call last):
  File "dataExtPlot.py", line 21, in <module>
    content = f.read()
AttributeError: 'NoneType' object has no attribute 'read'

另外,还有其他方法可以执行此任务吗?

雷蒙德·海廷格(Raymond Hettinger):

文件告诉我们,没有被返回extractfile()如果该成员是不是一个普通的文件或链接。

一种可能的解决方案是跳过“ 无”结果:

tar = tarfile.open("filename.tar.gz", "r:gz")
for member in tar.getmembers():
     f = tar.extractfile(member)
     if f is not None:
         content = f.read()

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

提取.gz文件中的.TAR文件

从Nim中的tar.gz存档中读取文件

R:从 tar.gz 目录中读取单个文件

排除tar.gz中的文件

从网站将.tar.gz文件的内容读取到python 3.x对象中

在不提取的情况下在python中读取* .tar.gz文件

从python中的tar存档中提取压缩的gz文件

Java TarInputStream 读取包含另一个 tar.gz 文件的 tar.gz 文件的文件名

如何使用 gnupg python 模块解密 tar.gz 文件

Python 3:从tar.gz存档中提取文件

如何在Windows中打开.tar.gz文件?

如何从tar.gz中仅提取所需的文件?

在setup.py中包含本地tar.gz文件

如何从github R包中获取tar.gz文件

如何在C#中创建tar.gz文件

Ruby-列出tar.gz档案中的文件

如何从tar.gz存档中删除单个文件

提取不同子目录中的.tar.gz文件

脚本中的sed创建了损坏的.tar.gz文件

如何处理 tar.gz 中的 .desktop 文件

如何重命名.tar.gz文件而不提取内容并在UBUNTU中创建新的.tar.gz文件?

在Pyspark中读取tar.gz存档时使用特定模式过滤文件

如何将 tar.gz 文件直接从 URL 读取到 Pandas 中?

解压缩.gz文件并将其存储在.tar.gz档案中

如何完全从Java中的内存(无文件)中的对象创建tar或tar.gz存档

如何使用 Python 在 flat tar.gz 中保存 tar 文件

tar.gz在压缩之前或之后将gzip文件压缩到tar中吗?

在 Ubuntu 中,如何检查 .tar(不是 tar.gz)文件是否已损坏?

Python -- 仅在目标文件夹中查找特定模式的 tar.gz 文件