如何使用python遍历多个文件夹中的所有文件

助剂11

我正在尝试遍历目录中的所有目录并在那里找到所有 .html 文件。到目前为止,我有这段代码:

def find_path():
"""

:return: List
"""
paths = []
for filename in os.listdir(DIRECTORY):
    if filename.endswith('.html'):
        fname = os.path.join(DIRECTORY, filename)
        with open(fname, 'r') as f:
            soup = BeautifulSoup(f.read(), 'html.parser')
            path = soup.select_one('#tree > li > span').contents[-1]
            paths.append(path)
return paths

但它只有在所有 .html 文件都在一个目录中时才有效。我需要的是遍历该目录中的所有 .html 文件并保存它,但是对于该目录中的每个目录,还有我需要访问的 .html 文件。所以理想情况下,我需要在我的父目录中打开所有这些目录,并从 .html 文件中保存我需要的任何内容。有没有办法做到这一点?

谢谢!

打电话给穆帕纳

您可以使用下面的示例片段 #1 或 #2 作品:

import os
path = "."
for (root, dirs, files) in os.walk(path, topdown=True):
    for file in files:
        if file.endswith(".html"):
            print(root+"/"+file)                #1
            print(os.path.join(root+"/"+file))  #2

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

遍历Python文件夹中的所有文件

遍历文件夹并使用文件夹名称顺序重命名每个文件夹中的所有文件

如何使用python删除文件夹中的所有文件夹?

如何遍历多个文件夹中的多个文件?

如果文件夹名称在bash中的变量中,如何遍历文件夹中的所有pdf文件?

循环遍历文件夹中的所有 .csv 文件

Python文件IO和zipfile。尝试遍历文件夹中的所有文件,然后使用Python遍历各个文件中的文本

如何遍历文件夹内所有工作簿中的所有工作表

遍历文件夹和子文件夹中的所有文件并获取创建日期

如何使用python和os合并特定文件夹中的所有csv文件

如何使用Python连接文件夹中的所有csv文件?

如何查找使用Python在特定文件夹中今天创建的所有文件

如何使用python代码处理文件夹中的所有文件

使用Angular遍历文件夹中的所有文件/图像

使用Argo Workflow遍历S3文件夹中的所有文件

如何使用 tkinter 在 python 中选择多个文件或整个文件夹(它包含的所有文件的显示名称)?

如何使用.gitignore忽略文件夹中的所有子文件夹

如何列出文件夹中的所有文件然后选择多个文件

Python为一个文件夹中的所有文件夹创建多个zip文件

如何使用vba遍历所有子文件夹及其子文件夹等等,以检查文件夹是否存在?

如何使用Powershell遍历文件夹中的文件并在文件上运行特定的python代码?

如何使用python合并文件夹中的多个.csv

如何遍历目录中的所有子文件夹,并删除具有特定文件名的文件

C# sharepoint 循环遍历文件夹和所有子文件夹中的所有文件

如何使用PowerShell从文件夹和所有子文件夹中删除所有访问规则?

如何使用python按名称加载文件夹中的所有图像?

如何使用Groovy读取文件夹中的所有文件并替换文件中的模式

如何使用bash将子文件夹中的所有文件移动到新文件夹中?

使用imagemagick识别多个子文件夹中的所有文件