我有多个zip文件,其中包含不同类型的txt文件。如下所示:
zip1
- file1.txt
- file2.txt
- file3.txt
如何使用熊猫读取每个文件而不提取它们?
我知道每个zip文件是否为1个文件,我可以对read_csv使用压缩方法,如下所示:
df = pd.read_csv(textfile.zip, compression='zip')
任何有关如何执行此操作的帮助都将非常有用。
你可以传递ZipFile.open()
到pandas.read_csv()
构建pandas.DataFrame
从包装成一个多文件一个CSV文件zip
。
pd.read_csv(zip_file.open('file3.txt'))
.csv
入字典的示例:from zipfile import ZipFile
zip_file = ZipFile('textfile.zip')
dfs = {text_file.filename: pd.read_csv(zip_file.open(text_file.filename))
for text_file in zip_file.infolist()
if text_file.filename.endswith('.csv')}
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句