使用os.walk（）检索特定目录

伊曼纽尔·奥西莫苏（Emmanuel Osimosu）

我有一组作业（job1，job2等）运行每隔一小时，并在完成后生成的文件夹（session1，session2等），其中包含的日志文件。由于存储限制，我需要一个脚本，该脚本可以删除早于设置时间限制的会话目录，但还希望指定该脚本必须保留指定数量的会话目录，例如保留最新的2个会话，即使它们早于设置的会话时限。

如何使用python实现此目的os.walk()？我想返回要删除的会话目录列表sessions_to_delete = []

/root    
    /job1             (runs every one hour)    
        /session1
            /*log
        /session2
        /session3
    /job2
        /session1
        /session2

马丁·彼得斯（Martijn Pieters）

在这种情况下，使用列出所有目录glob.glob()以匹配您的层次结构模式可能更容易。您可以os.path.getctime()用来获取每个目录的时间戳，以对目录进行排序和过滤

from glob import glob
import os.path
import time

def find_sessions_to_delete(cutoff):
    # produce a list of (timestamp, path) tuples for each session directory
    session_dirs = [(os.path.getctime(p), p) for p in glob('/root/job*/session*')]
    session_dirs.sort(reverse=True)  # sort from newest to oldest
    # remove first two elements, they are kept regardless
    session_dirs = session_dirs[2:]
    # return a list of paths whose ctime lies before the cutoff time
    return [p for t, p in session_dirs if t <= cutoff]

cutoff = time.time() - (7 * 86400)  # 7 days ago
sessions_to_delete = find_sessions_to_delete(cutoff)

我包括了一个7天前的示例截止日期，由计算得出time.time()，该日期返回一个整数值，表示自1970年1月1日（UNIX纪元）以来经过的秒数。

如果需要在每个作业目录中执行此操作，请在每个目录中执行相同的工作，然后合并结果列表：

def find_sessions_to_delete(cutoff):
    to_delete = []

    # process each jobdir separately
    for jobdir in glob('/root/job*'):
        # produce a list of (timestamp, path) tuples for each session directory
        session_dirs = [(os.path.getctime(p), p)
                        for p in glob(os.path.join(jobdir, 'session*'))]
        session_dirs.sort(reverse=True)  # sort from newest to oldest
        # remove first two elements, they are kept regardless
        session_dirs = session_dirs[2:]
        # Add list of paths whose ctime lies before the cutoff time
        to_delete.extend(p for t, p in session_dirs if t <= cutoff)

    return to_delete

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-03-26

我来说两句

0 条评论

登录后参与评论

上一篇：从JavaScript中的索引向后遍历数组

使用os.walk（）检索特定目录

使用os.walk（）检索特定目录

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Java Eclipse中的错误13，如何解决？

在Windows 7中无法删除文件（2）

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

套接字无法检测到断开连接

带有错误“ where”条件的查询如何返回结果？

有什么解决方案可以将android设备用作Cast Receiver？

Mac OS X更新后的GRUB 2问题

ggplot：对齐多个分面图-所有大小不同的分面

验证REST API参数

如何从视图一次更新多行（ASP.NET - Core）

尝试反复更改屏幕上按钮的位置 - kotlin android studio

计算数据帧中每行的NA

检索角度选择div的当前值

离子动态工具栏背景色

UITableView的项目向下滚动后更改颜色，然后快速备份

VB.net将2条特定行导出到DataGridView

蓝屏死机没有修复解决方案

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException