我目前有一个文件夹,其中包含多个我试图读取的具有相似名称的文件。例如:文件夹包含文件:
apple_2019_08_26_23434.xls
apple_2019_08_25_55345.xls
apple_2019_08_24_99345.xls
文件的名称格式非常简单:
apple_<date>_<5 random numbers>.xls
如果我不关心最后的5位随机数,如何将Excel文件读入pandas df中?
例如
df = pd.read_excel('e:\Document\apple_2019_08_26_<***wildcard***>.xls')
谢谢!
您可以通过glob使用unix样式的路径名扩展。
import glob
# get .txt files in current directory
txt_files = glob.glob('./*.txt')
# get .xls files in some_dir
xls_files = glob.glob('some_dir/*.xls')
# do stuff with files
# ...
在这里,*
基本上是指“任何东西”。
熊猫示例:
import glob
for xls_file in glob.glob('e:/Document/apple_2019_08_26_*.xls'):
df = pd.read_excel(xls_file)
# do stuff with df
# ...
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句