使用熊猫读取zip文件中包含的多个文件

约翰尼:

我有多个zip文件,其中包含不同类型的txt文件。如下所示:

zip1 
  - file1.txt
  - file2.txt
  - file3.txt

如何使用熊猫读取每个文件而不提取它们?

我知道每个zip文件是否为1个文件,我可以对read_csv使用压缩方法,如下所示:

df = pd.read_csv(textfile.zip, compression='zip') 

任何有关如何执行此操作的帮助都将非常有用。

斯蒂芬·劳赫(Stephen Rauch):

你可以传递ZipFile.open()pandas.read_csv()构建pandas.DataFrame从包装成一个多文件一个CSV文件zip

码:

pd.read_csv(zip_file.open('file3.txt'))

将所有内容读.csv入字典的示例

from zipfile import ZipFile

zip_file = ZipFile('textfile.zip')
dfs = {text_file.filename: pd.read_csv(zip_file.open(text_file.filename))
       for text_file in zip_file.infolist()
       if text_file.filename.endswith('.csv')}

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章