我正在尝试将多个XLS文件读取到熊猫的数据框中。它们似乎读入正确-但是当我尝试显示(df),df.info()或df.head()时,数据框为空。
所有数据都在名为的子文件夹中data1
。xls工作表的名称为a.xls
和b.xls
。
数据集如下:
xls
Account Description Final Adjustment Adj Final
324 Testing1 2342 0 2342
232 Essential 5678 0 5678
35 Options 2345 0 2345
634 Working 45 5675 5720
23 Time 45774 0 45774
52 Styling 67 0 67
b.xls
Account Description Final Adjustment Adj Final
343 Visual 345 0 345
576 IO Tools 34543 0 34543
6567 Options 6356 0 6356
8675 Pickling 7456 5675 13131
345 Clipboard 5678 0 5678
6365 Flat 2355 645 3000
码:
import pandas as pd
import os
from IPython.display import display, HTML
df = pd.DataFrame()
for filename in os.listdir('data1'):
if filename.endswith(".xls"):
print(f'appending {filename}')
data = pd.read_excel(os.path.join("data1", filename), sheet_name=0)
display(data)
df.append(data)
display(df)
else:
print(f'skipping {filename}, wrong data type')
输出:
appending a.xls
Account Description Final Adjustment Adj Final
0 324 Testing1 2342 0 2342
1 232 Essential 5678 0 5678
2 35 Options 2345 0 2345
3 634 Working 45 5675 5720
4 23 Time 45774 0 45774
5 52 Styling 67 0 67
___
appending b.xls
Account Description Final Adjustment Adj Final
0 343 Visual 345 0 345
1 576 IO Tools 34543 0 34543
2 6567 Options 6356 0 6356
3 8675 Pickling 7456 5675 13131
4 345 Clipboard 5678 0 5678
5 6365 Flat 2355 645 3000
___
在display(data)
产生上述的表中,但display(df)
产生___
。因此,我以某种方式将excel文件读入data
,但没有将其附加到df
。
df.info()
产生:
<class 'pandas.core.frame.DataFrame'>
Index: 0 entries
Empty DataFrame
我的问题是如何append
将data
到一个单一的数据框(df
)多个Excel工作簿。
您永远不会重新分配变量df
,然后数据框为空。你应该做:
df = df.append(data)
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句